YOLOV5数据标注询问

当前代码适用的是images文件夹里全为图片且annotations中每一个txt文件对应每一个图片的信息。请问如果我的images文件夹里包含多个文件夹，annotations中每一个txt包含多条信息，对应每一个文件夹里的每一张图片的信息，该如何修改以下代码呢？

from PIL import Image
import os

from os import walk
# 指定图片目录 - 根据需要更改为训练集(train)、验证集(val)和测试集(test-dev)的路径
image_dir = "VisDrone2019-VID-val/sequences/"
annot_dir = "VisDrone2019-VID-val/annotations/"
output_dir = "
![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/92cc982645a04f7fbdf6d4faaf103afe.png "#left")
VisDrone2019-VID-val/labels/"
remove_ignored = True  # 是否移除被标记为忽略的标注



# 如果输出目录不存在，则创建该目录
if not os.path.exists(output_dir):
    os.makedirs(output_dir)


def convert_annotation(img_size, bbox):
    """
    将VisDrone的边界框格式转换为YOLO的边界框格式（中心点坐标+宽高）
    参数:
    - img_size: 图像的尺寸，格式为(width, height)
    - bbox: VisDrone的边界框，格式为[x_min, y_min, width, height]
    返回:
    - 转换后的YOLO格式边界框，格式为[x_center, y_center, width, height]，值被归一化
    """
    width_div = 1.0 / img_size[0]
    height_div = 1.0 / img_size[1]
    return [(bbox[0] + bbox[2] / 2) * width_div, (bbox[1] + bbox[3] / 2) * height_div, bbox[2] * width_div,
            bbox[3] * height_div]


# 遍历标注目录中的所有文件
for annot_file in os.listdir(annot_dir):
    annot_path = os.path.join(annot_dir, annot_file)
    if not os.path.isfile(annot_path):
        continue

    base_name = os.path.splitext(annot_file)[0]
    image_folder_path = os.path.join(image_dir, base_name)

    if not os.path.exists(image_folder_path):
        print(f"Image folder not found: {image_folder_path}")
        continue

    # 获取图像文件列表，并按文件名排序
    image_files = sorted([f for f in os.listdir(image_folder_path) if f.lower().endswith('.jpg')])

    # 创建输出目录（如果不存在）
    output_folder = os.path.join(output_dir, base_name)
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    with open(annot_path, 'r', encoding='utf8') as f:
        for index, line in enumerate(f):
            data = line.strip().split(',')
            if len(data) < 6:
                continue

            # 获取图像文件名
            if index < len(image_files):
                image_file = image_files[index]
            else:
                print(f"Not enough images for annotation file: {annot_path}")
                continue

            image_path = os.path.join(image_folder_path, image_file)
            output_path = os.path.join(output_folder, f"{os.path.splitext(image_file)[0]}.txt")

            print(f"Processing image file: {image_path}")

            if not os.path.exists(image_path):
                print(f"Image file not found: {image_path}")
                continue

            img = Image.open(image_path)
            class_label = int(data[5]) - 1  # 假设YOLO的类别范围为0-9，0表示行人，9表示摩托车

            if remove_ignored:
                considered = data[4]  # 如果需要移除被忽略的标注，则检查当前标注是否被考虑
            else:
                considered = 1  # 如果不移除被忽略的标注，则考虑所有标注

            if considered != str(0) and (class_label >= 0) and (class_label <= 9):  # 检查是否为有效类别
                bounding_box_visdrone = [float(x) for x in data[1:5]]
                yolo_bounding_box = convert_annotation(img.size, bounding_box_visdrone)
                bounding_box_string = " ".join([str(x) for x in yolo_bounding_box])  # 创建要写入的标注字符串

                with open(output_path, 'w', encoding='utf-8') as output_file:
                    output_file.write(f"{class_label} {bounding_box_string}\n")  # 以YOLO格式写入转换后的标注和类别

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

何事_ 2024-08-18 09:46

关注

以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

你的代码目前假设图像文件和标注文件是一一对应的，即每一个图像文件夹内只有一个图像文件，并且该图像文件有一个对应的标注文件。但从你提供的图2和图3来看，每一个标注文件似乎对应多个图像文件。因此，你需要对代码进行一些修改以适应这种情况。

假设你的目录结构如下：

VisDrone2019-VID-val/
│
├── sequences/
│   ├── uav000008600000v/
│   │   ├── image1.jpg
│   │   ├── image2.jpg
│   │   └── ...
│   ├── uav0000117_02622_v/
│   │   ├── image1.jpg
│   │   ├── image2.jpg
│   │   └── ...
│   └── ...
├── annotations/
│   ├── uav000008600000v.txt
│   ├── uav000117_02622_v.txt
│   └── ...
└── labels/

在这种情况下，你可以按照以下步骤修改代码：

遍历sequences目录中的所有子目录。
对于每个子目录，检查其是否有对应的标注文件在annotations目录中。
如果有，读取该标注文件并处理其中的每一行。每一行应该对应一个图像文件的标注。
对于每一行中的标注，找到对应的图像文件（基于文件名），然后进行转换并写入到labels目录。

下面是一个简化的代码结构来帮助你理解：

import os
from PIL import Image
from your_script import convert_annotation  # 假设你已经定义了此函数

image_dir = "VisDrone2019-VID-val/sequences/"
annot_dir = "VisDrone2019-VID-val/annotations/"
output_dir = "VisDrone2019-VID-val/labels/"
remove_ignored = True  # 是否移除被标记为忽略的标注

# 遍历所有序列目录
for sequence_dir in os.listdir(image_dir):
    sequence_path = os.path.join(image_dir, sequence_dir)
    if not os.path.isdir(sequence_path):
        continue
    
    # 获取序列名称（例如：uav000008600000v）用于查找对应的标注文件
    sequence_name = sequence_dir.split('_')[0]  # 根据你的实际情况调整这部分代码以获取正确的序列名称
    annot_file = os.path.join(annot_dir, f"{sequence_name}.txt")  # 根据序列名称构建标注文件的路径
    if not os.path.exists(annot_file):
        print(f"No annotation file found for sequence: {sequence_name}")
        continue
    
    with open(annot_file, 'r', encoding='utf8') as f:
        for line in f:
            data = line.strip().split(',')  # 根据你的实际情况调整这部分代码以解析标注文件的内容
            if len(data) < 6:  # 假设每一行至少有6个字段（根据实际情况调整）
                continue  # 如果行数不够则跳过当前行（你可能需要根据实际情况进行更多检查）
            image_file = data[index]  # 获取当前行的图像文件名（index取决于你的数据格式）你可能需要调整这部分代码以正确获取文件名。这里只是一个示例。假设文件名在最后一个字段之前。如果数据格式不同，请相应地调整这部分代码。你也可以使用其他方式来找到文件名和标注行的对应关系，比如根据序列编号和图片编号结合来生成文件名等。使用更稳健的方式来确保文件的匹配是很重要的。另外确保在使用之前确认index是否正确以避免出现索引越界错误等问题。然后根据其他数据和给定的逻辑继续你的转换逻辑和输出处理逻辑... (具体代码细节还需要根据实际的数据格式来进一步开发和测试。)根据你提供的数据格式和你的需求进行具体的处理。这个过程涉及到很多细节和复杂性，包括确保文件的匹配关系正确等，所以需要仔细地检查和测试以确保结果的准确性。由于具体的细节可能涉及很多变化和不一致性，因此这里只是一个基本的框架和思路供你参考。具体的实现需要根据你的实际情况进行调整和测试。

报告相同问题？

关注问题

【YOLOv5目标检测教学】包括环境配置、数据集制作、模型训练、加载模型进行目标检测（超详细、小白入门版）
2024-10-21 14:14

音沐mu.的博客本文将全面阐述yolov5目标检测使用教学，首先是配置yolov5的运行环境以及yolov5的代码下载，然后教学如何制作自己的目标检测数据集以及如何利用yolov5加载该数据集进行目标检测模型训练，最后教学如何通过yolov5加载...
Yolov5的配置+训练（超级详细！！！）
2021-12-08 12:13

小学生玩编程的博客 base_dir, "labels/") if not os.path.isdir(yolov5_labels_dir): os.mkdir(yolov5_labels_dir) clear_hidden_files(yolov5_labels_dir) yolov5_images_train_dir = os.path.join(yolov5_images_dir, "train/") if ...
YOLO-V8训练自己的数据集之标注样本
2023-10-19 11:16

电阻电容及电线的博客四、标注样本 4.1、标注样本概述 4.1.1、样本标注主要方法 4.1.2、标注样本概念 4.1.3、标注样本实现方式 4.1.4、常见标注样本软件 4.2、标注工具LabelImg 4.2.1、LabelImg介绍 4.2.2、LabelImg特点 4.2.3、LabelImg...
使用YOLOV5训练好的模型并对识别结果进行标注
2023-05-03 22:33

慕容星言的博客如何使用YOLOV5自己训练出的模型
YOLOv5火焰烟雾检测
2022-08-09 17:47

AI耽误的大厨的博客 YOLOv5火焰烟雾检测
Linux 服务器上部署 YOLOv5 并训练自定义数据集
2025-06-18 19:31

FIREINWORLD2的博客 3)自定义数据集训练方法，涵盖数据标注、格式转换、配置文件修改等关键步骤。教程还提供了常见问题解决方法，如DNS配置、wandb报错处理等。通过本教程，读者可掌握从环境搭建到模型训练的全套技能，实现特定目标（如...
从O到1：YOLOV5训练自己的目标检测数据集，并使用C++部署，python部署，树莓派等等。
2023-10-19 15:50

想写C++的AI初学者的博客从O到1：YOLOV5训练自己的目标检测数据集。
【 YOLOv5】目标检测 YOLOv5 开源代码项目调试与讲解实战（3）-训练yolov5模型（本地）
2023-12-28 15:49

醉酒柴柴的博客训练yolov5模型（本地）
YOLOv1-v5总结
2024-08-03 23:41

讳疾忌医丶的博客每个网格只对应两个bounding box，当物体的长宽比不常见(也就是训练数据集覆盖不到时)，效果较差。原始图片只划分为7x7的网格，当两个物体靠的很近时，效果比较差。最终每个网格只对应一个类别，容易出现漏检(物体...
【毕设记录日记】深度学习|铝型材表面缺陷视觉检测算法：YOLOv5环境搭建、基础知识、问题解决、优化方法
2022-04-26 21:54

SylviaMiller的博客 1 YOLOv5环境搭建 1.1 视频版教程手把手教你搭建自己的yolov5目标检测平台_哔哩哔哩_bilibili 1.2 文字版教程 1.2.1 专栏链接 https://blog.csdn.net/didiaopao/category_11321656.html 1.2.2 详细页面注：...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月18日

YOLOV5数据标注询问

2条回答 默认 最新

问题事件

2条回答默认最新