数据标注:labelTools数据标注中xml文件转化为txt文件

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/u013419318/article/details/102565047

1 介绍

在利用labelTools对数据进行标注的时候,经常容易忘记选择YOLO选项,导致标注出来的标签文件是xml格式,该格式无法用于目标检测任务的训练,因此,本文主要介绍了一种可以批量读取xml文件并将其转化为txt文件格式的方法。代码如下。

2 代码 

import os
import xml.etree.ElementTree as ET
from decimal import Decimal

dirpath = 'E:\\0911-0951最后一个文件夹\\20190215-211313 {3D675E7F-B913-41B0-B915-9381A662A919}(SHDT-0916(A))\\ZXB_LC01D\\xml'  # 原来存放xml文件的目录
newdir = 'E:\\0911-0951最后一个文件夹\\20190215-211313 {3D675E7F-B913-41B0-B915-9381A662A919}(SHDT-0916(A))\\ZXB_LC01D\\new_label'  # 修改label后形成的txt目录

if not os.path.exists(newdir):
    os.makedirs(newdir)

for fp in os.listdir(dirpath):

    root = ET.parse(os.path.join(dirpath, fp)).getroot()

    xmin, ymin, xmax, ymax = 0, 0, 0, 0
    sz = root.find('size')
    width = float(sz[0].text)
    height = float(sz[1].text)
    filename = root.find('filename').text
    print(fp)
    with open(os.path.join(newdir, fp.split('.')[0] + '.txt'), 'a+') as f:
        for child in root.findall('object'):  # 找到图片中的所有框

            sub = child.find('bndbox')  # 找到框的标注值并进行读取
            sub_label = child.find('name')
            xmin = int(sub[0].text)
            ymin = int(sub[1].text)
            xmax = int(sub[2].text)
            ymax = int(sub[3].text)
            try:  # 转换成yolov3的标签格式,需要归一化到(0-1)的范围内
                x_center = Decimal(str(round(float((xmin + xmax) / (2 * width)),6))).quantize(Decimal('0.000000'))
                y_center = Decimal(str(round(float((ymin + ymax) / (2 * height)),6))).quantize(Decimal('0.000000'))
                w = Decimal(str(round(float((xmax - xmin) / width),6))).quantize(Decimal('0.000000'))
                h = Decimal(str(round(float((ymax - ymin) / height),6))).quantize(Decimal('0.000000'))
                print(str(x_center) + ' ' + str(y_center)+ ' '+str(w)+ ' '+str(h))
                if sub_label.text == 'FrontBolt':
                    f.write(' '.join([str(0), str(x_center), str(y_center), str(w), str(h) + '\n']))
                if sub_label.text == 'SideBolt':
                    f.write(' '.join([str(1), str(x_center), str(y_center), str(w), str(h) + '\n']))
                if sub_label.text == 'Part':
                    f.write(' '.join([str(2), str(x_center), str(y_center), str(w), str(h) + '\n']))
            except ZeroDivisionError:
                print(filename, '的 width有问题')

            # with open(os.path.join(newdir, fp.split('.')[0] + '.txt'), 'a+') as f:
            #     f.write(' '.join([str(2), str(x_center), str(y_center), str(w), str(h) + '\n']))

3 效果展示 

右边为转化之前的xml文件,左边为转化之后的txt文件。

猜你喜欢

转载自blog.csdn.net/u013419318/article/details/102565047
今日推荐