EAST-icdar.py-get_batch

前言

今天是model的最后一部分了,整个icdar就剩最后这一段了,前面自定义部分也在前面的部分中大多数带到了。

代码

def get_batch(num_workers, **kwargs):
    #**kwargs:形参中按照关键字传值把多余的传值以字典的方式呈现
    '''
    在实现按批次处理??
    将各张图片以三个对象压人队列信息进行处理(内部主要实现了多线程,并没有具体处理??)
    :param num_workers:
    :param kwargs:
    :return:
    '''
    try:
        enqueuer = GeneratorEnqueuer(generator(**kwargs), use_multiprocessing=True)
        #传入的第一个参数为迭代器
        enqueuer.start(max_queue_size=24, workers=num_workers)
        generator_output = None
        while True:
            while enqueuer.is_running():
                if not enqueuer.queue.empty():
                    generator_output = enqueuer.queue.get()
                    #put放进去 get拿出来
                    #拿到处理图片的某一进程
                    break
                else:
                    time.sleep(0.01)
            yield generator_output
            generator_output = None
    finally:
        #finally块的作用就是为了保证无论出现什么情况,finally块里的代码一定会被执行。
        #结束进程
        if enqueuer is not None:
            enqueuer.stop()

作用

利用多线程生成数据:当CPU读取数据跟不上GPU处理数据速度时候可以考虑这种方式,这种方法的好处是数据接口简单而且可以大幅加快网络训练时间。特别是针对服务器端超多核CPU配置。实验证实,该方法可以大大提升GPU的利用率。这段的代码主要是一个:batch生成器。至于GeneratorEnqueuer的定义直接调用的现成的:

from data_util import GeneratorEnqueuer

网上也有自定义的版本,而关于batch生成器的定义也是大同小异。

发布了20 篇原创文章 · 获赞 0 · 访问量 420

猜你喜欢

转载自blog.csdn.net/weixin_44929101/article/details/105117284
py