目标检测 YOLOv5 - YOLOv5:v6版本多机多卡训练出现的错误及解决方案 - 代码天地

目标检测 YOLOv5 - YOLOv5:v6版本多机多卡训练出现的错误及解决方案

企业开发 2023-01-24 01:29:41 阅读次数: 0

2021年4月份发布的 YOLOv5:v5版本，2021年10月份发布的 YOLOv5:v6版本
发布了更小的Nano模型YOLOv5n和YOLOv5n6

一. 改进的方面
整合了 Roboflow，使用Roboflow来组织、标注、准备、版本化和托管用于训练YOLOv5模型的数据集，Roboflow上有很多公开的数据集。

二. 当采用多机多卡训练时，出现了以下问题

TypeError: barrier() got an unexpected keyword argument ‘device_ids’

代码出错的地方utils/torch_utils.py

def torch_distributed_zero_first(local_rank: int):
    """
    Decorator to make all processes in distributed training wait for each local_master to do something.
    """
    if local_rank not in [-1, 0]:
        dist.barrier(device_ids=[local_rank])
    yield
    if local_rank == 0:
dist.barrier(device_ids=[0])

原因是PyTorch版本，YOLOv5的推荐的Python>=3.6.0，PyTorch>=1.7。
PyTorch>=1.7的函数

torch.distributed.barrier(group=<object object>, async_op=False)

看看新的PyTorch 1.9的函数

torch.distributed.barrier(group=None, async_op=False, device_ids=None)

再看看PyTorch 1.8的函数

torch.distributed.barrier(group=None, async_op=False, device_ids=None)

通过比较发现2021年10月份发布的 YOLOv5:v6版本，使用的PyTorch并不是1.7版本，最简单的方法就是升级下自己PyTorch版本，至少1.8。
也可以按照 YOLOv5的一贯做法，加一个check_requirements()主要是检测 torch>=1.8.0。

第二种方式：
将上述代码替换成：

@contextmanager
def torch_distributed_zero_first(local_rank: int):
    """
    Decorator to make all processes in distributed training wait for each local_master to do something.
    """
    if local_rank not in [-1, 0]:
        torch.distributed.barrier()
    yield
    if local_rank == 0:
        torch.distributed.barrier()

猜你喜欢

转载自blog.csdn.net/zqwwwm/article/details/124143091

目标检测 YOLOv5 - YOLOv5:v6版本多机多卡训练出现的错误及解决方案

yolov5 目标检测

YOLOv5目标检测

目标检测——YOLOv5（八）

yolov5实现旋转目标检测

【目标检测】YOLOV5详解

目标检测yolov5的安装

YOLOV5目标检测记录

【目标检测】yolov5模型详解

YOLOv5目标检测（数据集的训练及预测）

yolov5创建数据集并训练目标检测模型

使用Yolov5进行端到端目标检测

YOLOv5环境搭建与目标检测

Yolov5—实现目标检测（win10）

yolov5 python flask web目标检测

Yolov5的安装配置及实现目标检测

用YOLOV5初步实现目标检测

基于yolov5的目标检测与LPRnet的车牌识别

目标检测：Yolov5集百家之长

模式识别：动物目标检测——YOLOv5开发

【快速入门】YOLOv5目标检测算法

YOLOv5目标检测（win下labelimg下载及使用）

YOLOv5小目标检测（方法与评价）

简单粗暴提升yolov5小目标检测能力

YOLOv5目标检测入门学习路线及视频

【目标检测】使用TensorRT加速YOLOv5

【目标检测】YOLOv5在Android上的部署

YOLOv5小目标切图检测

Yolov5目标检测自动标注生成xml

基于yolov5的农业害虫图像目标检测

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)