环境
Windows10+Python3.6
实践内容
手势识别(识别1,2,3,4,5的手势)
构造数据集
1、录制视频,用于数据集收集
2、使用opencv的方法截取视频帧
import cv2
vc = cv2.VideoCapture('shoushi3.mp4') # 读入视频文件
c = 1
if vc.isOpened(): # 判断是否正常打开
rval, frame = vc.read()
else:
rval = False
timeF = 3 # 视频帧计数间隔频率
while rval: # 循环读取视频帧
rval, frame = vc.read()
if (c % timeF == 0): # 每隔timeF帧进行存储操作
cv2.imwrite('img_data/' + str(c+4500) + '.jpg', frame) # 存储为图像
c = c + 1
cv2.waitKey(1)
vc.release()
3.选取图片(选取较为清晰的手势图片、删掉模糊的)
打标签
使用labelImg的方式对图片进行标注
1、IabelImg工具可在github上自行下载
2、解压后运行python IabelImg.py
3、开始标注
4、标记完成生成大量的xml文件
5、文件格式
表示图片中标签的位置和类别信息
到此,数据集准备完毕。
下一篇、构造可用于数据读取的迭代器