文章目录
前言
YOLO网络的数据集是txt文本,当我们想训练一些模型,在网上找的数据都是xml格式,这时候我们需要对数据进行处理,得到我们想要的数据格式。
一、数据处理流程
1.读取xml文件,解析xml 得到图片的宽,高,标定框的坐标信息
2.数据归一化
3.写入txt文件
二、xml文件数据格式
上图所示,是我截取xml文件的部分数据,我们只需要得到size中的width,height和bndbox中的坐标信息。
三、代码
import os
import glob
import xml.etree.ElementTree as ET
xml_file=r'E:\桌面\资料\cv4\数据集\voc数据集\Annotations'
l=['aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus', 'car', 'cat', 'chair', 'cow', 'diningtable', 'dog',
'horse', 'motorbike', 'person', 'pottedplant', 'sheep', 'sofa', 'train', 'tvmonitor']
def convert(box,dw,dh):
x=(box[0]+box[2])/2.0
y=(box[1]+box[3])/2.0
w=box[2]-box[0]
h=box[3]-box[1]
x=x/dw
y=y/dh
w=w/dw
h=h/dh
return x,y,w,h
def f(name_id):
xml_o=open(r'E:\桌面\资料\cv4\数据集\voc数据集\Annotations\%s.xml'%name_id)
txt_o=open(r'E:\桌面\资料\cv4\数据集\voc数据集\labels1\%s.txt'%name_id,'w')
pares=ET.parse(xml_o)
root=pares.getroot()
objects=root.findall('object')
size=root.find('size')
dw=int(size.find('width').text)
dh=int(size.find('height').text)
for obj in objects :
c=l.index(obj.find('name').text)
bnd=obj.find('bndbox')
b=(float(bnd.find('xmin').text),float(bnd.find('ymin').text),
float(bnd.find('xmax').text),float(bnd.find('ymax').text))
x,y,w,h=convert(b,dw,dh)
write_t="{} {:.5f} {:.5f} {:.5f} {:.5f}\n".format(c,x,y,w,h)
txt_o.write(write_t)
xml_o.close()
txt_o.close()
name=glob.glob(os.path.join(xml_file,"*.xml"))
for i in name :
name_id=os.path.basename(i)[:-4]
f(name_id)
总结
以上就是xml转txt文件的全部内容,在使用过程中出现什么问题,可以在评论区留言。