JSON文件转YOLO文件示例

前言

将JSON标注文件转换为YOLO格式通常涉及从JSON文件中提取图像尺寸、对象类别和边界框坐标,并将这些信息格式化为YOLO格式所需的格式。YOLO格式通常要求每行包含一个对象的类别ID、归一化后的中心坐标(x, y)以及归一化后的宽度和高度(w, h)。

一、步骤指南

  • 读取JSON文件:使用Python的json库读取JSON文件。
  • 提取图像尺寸:从JSON数据中获取图像的宽度和高度。
  • 遍历标注:遍历JSON数据中的标注列表。
  • 提取边界框和类别:对于每个标注,提取边界框的坐标(通常是左上角和右下角的x, y坐标)和对象类别。
  • 转换边界框:将边界框坐标转换为YOLO格式所需的归一化中心坐标和宽度/高度。
  • 写入YOLO格式文件:将类别ID和归一化后的边界框坐标写入文本文件,每行一个对象。

二、代码实现

1.类别名称到ID的映射

import json  
import os  
  
# 类别名称到ID的映射  
name2id = {
    
    'dog': 0, 'cat': 1}  # 根据您的数据集添加更多类别  

这是一个字典,将类别名称(如dog和cat)映射到对应的ID(整数)。这是因为在YOLO格式中,目标类别是通过整数ID来表示的。

2.边界框转换函数

def convert(size, box):  
    dw = 1. / size[0]  
    dh = 1. / size[1]  
    x = (box[0] + box[2]) / 2.0  
    y = (box[1] + box[3]) / 2.0  
    w = box[2] - box[0]  
    h = box[3] - box[1]  
    x = x * dw  
    y = y * dh  
    w = w * dw  
    h = h * dh  
    return x, y, w, h
  • 定义一个函数,这个函数接受两个参数:size(图像的宽度和高度)和box(边界框的坐标,格式为[x1, y1, x2, y2])。
  • 将边界框的坐标转换为相对于图像尺寸的比例,并计算边界框的中心点(x, y)和宽度(w)及高度(h)。且这些值被归一化到0到1的范围内,这是YOLO格式的要求。

3.JSON解码函数

def decode_json(json_folder_path, json_filename):  
    # 构造YOLO格式文件的路径  
    txt_filename = os.path.join('F:\\path\\to\\your\\labels', json_filename.replace('.json', '.txt'))  
    with open(txt_filename, 'w') as txt_file:  
        # 读取JSON文件  
        json_path = os.path.join(json_folder_path, json_filename)  
        with open(json_path, 'r', encoding='utf-8') as json_file:  # 根据您的JSON文件编码选择正确的编码  
            data = json.load(json_file)  
          
        # 提取图像尺寸(这里假设JSON结构有一个'width'和'height'字段)  
        img_width = data.get('width', 0)  
        img_height = data.get('height', 0)  
          
        # 遍历标注(这里假设JSON结构有一个'annotations'或'objects'字段包含标注列表)  
        for annotation in data.get('annotations', data.get('objects', [])):  
            label_name = annotation['label']  # 提取类别名称  
            if label_name in name2id:  # 检查类别名称是否在映射中  
                # 提取边界框坐标(这里假设边界框是一个包含四个元素的列表或数组:[x1, y1, x2, y2])  
                bbox = annotation['bbox'] if 'bbox' in annotation else annotation['points'][0:2] + annotation['points'][2:4]  # 根据您的JSON结构选择正确的字段  
                x1, y1, x2, y2 = bbox  
                  
                # 转换边界框并写入文件  
                x, y, w, h = convert((img_width, img_height), (x1, y1, x2, y2))  
                txt_file.write(f"{
      
      name2id[label_name]} {
      
      x} {
      
      y} {
      
      w} {
      
      h}\n")  

  • 定义函数,这个函数接受JSON文件夹的路径和JSON文件的名称作为输入。

  • 首先构造YOLO格式文件的输出路径。然后,它读取并解析JSON文件,提取图像的宽度和高度,以及标注信息。对于每个标注,它检查类别名称是否在name2id映射中。如果是,它提取边界框坐标,调用convert函数进行转换,并将结果写入YOLO格式的文本文件中。

4.主程序

if __name__ == "__main__":  
    json_folder_path = 'F:\\path\\to\\your\\jsons'  # 替换为您的JSON文件夹路径  
    json_filenames = os.listdir(json_folder_path)  
    for json_filename in json_filenames:  
        if json_filename.endswith('.json'):  # 只处理JSON文件  
            decode_json(json_folder_path, json_filename)
  • 这是脚本的入口点。当脚本被直接运行时,这部分代码会被执行。
  • 它设置JSON文件夹的路径,列出该文件夹中的所有文件,并对每个以.json结尾的文件调用decode_json函数。

猜你喜欢

转载自blog.csdn.net/2301_77698138/article/details/143345114