以下是针对算能平台(Sophgo)上 YOLOv5 INT8量化的样本选择指南,涵盖数据选择、预处理、校准策略及优化技巧,帮助您在保证精度的同时最大化推理效率。
核心原则
- 代表性 > 数量:校准数据需覆盖实际场景中的物体尺度、遮挡、光照、背景复杂度。
- 效率优先:样本量控制在 200-500张(过少导致统计偏差,过多增加校准时间)。
- 硬件适配:数据格式需对齐算能芯片(如BM1684)的输入要求(
NCHW
格式、归一化范围)。
数据选择策略
1. 来源优先级
数据来源 | 适用场景 | 注意事项 |
---|---|---|
训练集随机子集 | 数据集分布均衡且覆盖完整 | 需排除过拟合样本 |