码农-小林 2025-09-09 10:00 采纳率: 54.8%

已结题

Yolov3：win10下训练自己的数据（整理图集遇到问题）

为什么运行voc_labels.py文件时候，存放YOLO文件夹的所有文件标注信息都被清空，且运行可以执行完毕就是在生成目录下main没有生成对应的2025_train.txt和 2025_val.txt.
这是文件目录Annotations是存xml文件，labels是存转换后的txt文件，：

这是目录下LimgeSets下main自定义train和val，其中train存了所有图片的文件名，val为空

这是labels下的

这是没有运行voc_labels.py文件时候labels中一个图片的YOLO信息

这是运行voc_labels.py文件时候labels中一个图片的YOLO信息都被清空了

这是voc_labels.py文件

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join
 
sets = [('2025', 'train'), ('2025', 'val')]
classes = ["shu"]
 
def convert(size, box):
    dw = 1./size[0]
    dh = 1./size[1]
    x = (box[0] + box[1])/2.0
    y = (box[2] + box[3])/2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)
 
def convert_annotation(year, image_id):
    in_file = open(f'D:\\YOLO\\Darknet\\scripts\\VOCdevkit\\VOC{year}\\Annotations\\{image_id}.xml')
    out_file = open(f'D:\\YOLO\\Darknet\\scripts\\VOCdevkit\\VOC{year}\\labels\\{image_id}.txt', 'w')
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
 
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text),
             float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w, h), b)
        out_file.write(f"{cls_id} {' '.join([str(a) for a in bb])}\n")
 
wd = getcwd()
 
for year, image_set in sets:
    label_dir = f'D:\\YOLO\\Darknet\\scripts\\VOCdevkit\\VOC{year}\\labels\\'
    if not os.path.exists(label_dir):
        os.makedirs(label_dir)
    image_ids = open(f'D:\\YOLO\\Darknet\\scripts\\VOCdevkit\\VOC{year}\\ImageSets\\Main\\{image_set}.txt').read().strip().split()
    list_file = open(f'{year}_{image_set}.txt', 'w')
    for image_id in image_ids:
        list_file.write(f'D:\\YOLO\\Darknet\\build\\x64\\data\\obj\\{image_id}.jpg\n')
        convert_annotation(year, image_id)
    list_file.close()
 
# 合并 train 和 val 文件
try:
    with open('train.txt', 'w') as f:
        with open('2025_train.txt', 'r') as f1:
            f.write(f1.read())
        with open('2025_val.txt', 'r') as f2:
            f.write(f2.read())
    print("train.txt 已成功生成！")
except Exception as e:
    print(f"生成 train.txt 失败: {e}")
#if os.access("file.txt", os.W_OK):
 #   print("You have write permission to the file.")
#else:
  #  print("You do not have write permission to the file.")
#print("train.txt 已成功生成！")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2025-09-09 10:01
关注
上午好☀️☀️☀️️
本答案参考通义千问

根据你描述的问题，在运行 voc_labels.py 时，所有标注信息被清空，并且没有生成 2025_train.txt 和 2025_val.txt 文件，这说明代码中存在一些逻辑错误或路径配置问题。

一、问题分析

1. 标注信息被清空的原因

在你的 voc_labels.py 中，convert_annotation() 函数直接写入了 labels 目录下的 .txt 文件。
但如果你的 labels 目录中已经存在某些 .txt 文件（比如之前运行过一次），那么每次运行脚本时，它会覆盖这些文件，导致数据丢失。
注意： 如果你期望保留之前的标签文件，应该避免覆盖。如果希望每次都重新生成，则需要确认是否真的要清空已有标签。

2. 没有生成 2025_train.txt 和 2025_val.txt 的原因

脚本中定义了 sets = [('2025', 'train'), ('2025', 'val')]，但在处理过程中并没有正确地将 image_set 写入到对应的 2025_train.txt 和 2025_val.txt。
问题出在 for year, image_set in sets: 这部分逻辑，year 是 '2025'，而 image_set 是 'train' 或 'val'，但后续写入文件时使用的是 f'{year}_{image_set}.txt'，即生成了 2025_train.txt 和 2025_val.txt。
然而，在最后合并 train.txt 时，代码尝试读取 2025_train.txt 和 2025_val.txt，但这两个文件可能并未被创建，因为：
文件未被正确保存（如路径错误）；
文件写入失败（如权限问题）；
文件未被正确命名（如拼写错误）。

二、解决方案

1. 修改 voc_labels.py 文件以确保正确生成文件

修改后的代码如下：

import xml.etree.ElementTree as ET import os from os import listdir, getcwd from os.path import join sets = [('2025', 'train'), ('2025', 'val')] classes = ["shu"] def convert(size, box): dw = 1. / size[0] dh = 1. / size[1] x = (box[0] + box[1]) / 2.0 y = (box[2] + box[3]) / 2.0 w = box[1] - box[0] h = box[3] - box[2] x = x * dw w = w * dw y = y * dh h = h * dh return (x, y, w, h) def convert_annotation(year, image_id): in_file = open(f'D:\\YOLO\\Darknet\\scripts\\VOCdevkit\\VOC{year}\\Annotations\\{image_id}.xml') out_file = open(f'D:\\YOLO\\Darknet\\scripts\\VOCdevkit\\VOC{year}\\labels\\{image_id}.txt', 'w') tree = ET.parse(in_file) root = tree.getroot() size = root.find('size') w = int(size.find('width').text) h = int(size.find('height').text) for obj in root.iter('object'): difficult = obj.find('difficult').text cls = obj.find('name').text if cls not in classes or int(difficult) == 1: continue cls_id = classes.index(cls) xmlbox = obj.find('bndbox') b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text)) bb = convert((w, h), b) out_file.write(f"{cls_id} {' '.join([str(a) for a in bb])}\n") out_file.close() # 获取当前工作目录 wd = getcwd() for year, image_set in sets: label_dir = f'D:\\YOLO\\Darknet\\scripts\\VOCdevkit\\VOC{year}\\labels\\' if not os.path.exists(label_dir): os.makedirs(label_dir) # 读取图像ID列表 image_ids = open(f'D:\\YOLO\\Darknet\\scripts\\VOCdevkit\\VOC{year}\\ImageSets\\Main\\{image_set}.txt').read().strip().split() # 创建并写入对应文件 list_file = open(f'{year}_{image_set}.txt', 'w') for image_id in image_ids: list_file.write(f'D:\\YOLO\\Darknet\\build\\x64\\data\\obj\\{image_id}.jpg\n') convert_annotation(year, image_id) list_file.close() # 合并 train 和 val 文件 try: with open('train.txt', 'w') as f: for file_name in ['2025_train.txt', '2025_val.txt']: with open(file_name, 'r') as f_in: f.write(f_in.read()) print("✅ train.txt 已成功生成！") except Exception as e: print(f"❌ 生成 train.txt 失败: {e}")

三、重点问题说明

1. 文件路径问题

原路径： D:\\YOLO\\Darknet\\scripts\\VOCdevkit\\VOC{year}\\
建议检查： 确保路径中没有中文字符或特殊符号，否则可能导致文件无法写入。
推荐做法： 使用 os.path.join() 替代硬编码路径。

2. 文件覆盖问题

如果你不想每次运行都覆盖已有标签文件，可以在 convert_annotation() 中添加判断：

if os.path.exists(out_file.name): print(f"⚠️ 文件 {out_file.name} 已存在，跳过写入。") else: # 正常写入

3. 权限问题

检查路径权限： 确保你有权限在目标路径下创建和写入文件。
建议： 使用管理员权限运行脚本（右键“以管理员身份运行”）。

四、验证步骤

确保目录结构正确：

VOCdevkit/ └── VOC2025/ ├── Annotations/ ├── ImageSets/ │ └── Main/ │ ├── 2025_train.txt │ └── 2025_val.txt ├── labels/ └── JPEGImages/

运行 voc_labels.py 后检查：

labels/ 目录下是否有 .txt 文件？
2025_train.txt 和 2025_val.txt 是否已生成？

查看 train.txt 是否包含图片路径：

该文件用于 Darknet 训练时的图像路径列表。

五、总结

| 问题 | 解决方案 | |------|----------| | 标注信息被清空 | 确保不重复覆盖已有标签文件 | | 2025_train.txt 和 2025_val.txt 未生成 | 检查路径、权限、文件名拼写 | | 文件路径错误 | 使用 os.path.join() 避免硬编码 |

如有更多问题，请提供完整的项目目录结构和报错日志，我可以进一步帮助你排查。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

口罩训练数据集及标注文件（适用于 YOLOV5 及NANODET）.zip
2024-03-17 22:53

【资源说明】 1、该资源包括项目的全部源码，下载可以直接使用！ 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目，作为...口罩训练数据集及标注文件（适用于 YOLOV5 及NANODET）.zip
【大作业-08】YOLOV5火灾检测数据集+代码+模型 2000张标注好的数据+教学视频
2022-02-19 19:52

YOLOV5火灾检测数据集+代码+模型 2000张标注好的数据+教学视频
人工智能训练数据集合集.zip
2021-08-23 16:17

ICDAR2003：文本识别数据集：ICDAR2003 训练集1156张测试集 1110标签中都是每张图片上对应的单词train.txt和test.txt都是过滤之后的标签（去掉符号和小于3个字符的）。 CUTE80：CUTE80数据集，都是弧形文字，包含...
手把书教你使用YOLOv8训练自己的数据集(附YOLOv8模型结构图)
2024-08-07 14:41

落花不写码的博客 YOLOv8 是由Ultralytics团队开发的，2023 年发布。YOLO系列模型以其快速和准确的目标检测能力而闻名，并且YOLOv8继承了前几代YOLO模型的优点，同时进行了多方面的改进和优化，以提高检测性能和效率。YOLOv8 常用于...
CSGO 端游实战人物图片数据集6000+ 可用于训练YoloV5模型
2023-04-18 10:54

可以用于多种模型训练需要标注数据, 以及其他数据集请联系博主 QQ:3180433576
使用YOLOv10训练自定义数据集之二（数据集准备）
2024-09-06 22:23

counsellor的博客经过上一篇环境部署的介绍【传送门】，我们已经得到了一个基本可用的YOLOv10的运行环境，还需要我们再准备一些数据，用于模型训练。
YOLOv8目标追踪实战全套资源包 - 源码与数据集完整分享
2023-12-27 14:00

这一资源包含了完整的YOLOv8目标追踪项目的源码和相关数据集，旨在为学习和研究YOLOv8提供一个实际操作的案例。资源内的源码基于最新的YOLOv8模型，专注于实现高效准确的物体追踪功能，并且适用于各种现实场景。此外...
YOLOV8 PUBG训练模型
2024-12-20 14:25

YOLOV8 PUBG训练模型
YOLOV4 windows10系统训练自己的图片数据集（robomaster官方数据集）
2020-04-28 17:36

小景-SCUT的博客首先，当然是要配置好环境啦，这里相信屏幕前的你已经配置好了，如果没有配置...一、配置好之后，最重要的就是数据集，因为博主报名参加了RM比赛，所以就用大疆给的官方数据集试验了一下，首先准备两个数据集，一个...
CIFAR-10数据集的JPG格式图像
2025-06-12 11:05

资源下载链接为： https://pan.quark.cn/s/5c50e6120579 CIFAR-10数据集包含训练集和测试集。训练集有50000张图片，测试集有10000张图片，这些图片都是JPG格式。每张图片的文件名中都包含了对应的标签信息。
yolov8 关键点pose自有数据集训练
2024-07-23 14:39

loong_XL的博客 8, 9, 10, 11] # Classes names: 0: tiger 训练： yolo pose mode=train model=yolov8n-pose.pt data=tiger-pose.yaml epochs=300 device=1 预测： yolo pose predict model=/mnt/data/loong/pose/runs/pose/train3/...
基于tensorflow分布式训练的CNN图像识别，基于自己的图片数据集开发.zip
2024-03-27 16:53

在当前的IT领域，人工智能（AI）已经成为了一个热门的研究方向，而深度学习是实现AI的重要技术之一。TensorFlow，作为谷歌开发的一个强大的开源库，为深度学习提供了丰富的工具和平台，使得开发者能够构建复杂的神经...
yolo算法-瓶子数据集-701张图像带标签-瓶子.zip
2024-11-17 20:13

yolo系列算法目标检测数据集，包含标签，可以直接训练模型和验证测试，数据集已经划分好，包含数据集配置文件data.yaml，适用yolov5,yolov8,yolov9,yolov7,yolov10,yolo11算法；包含两种标签格:yolo格式（txt文件）...
基于深度学习YOLOv10的扑克牌识别检测系统（YOLOv10+YOLO数据集+UI界面+Python项目源码+模型）
2025-07-24 12:52

YOLO项目的博客本项目基于YOLOv10目标检测算法开发了一套高精度的扑克牌识别检测系统，能够准确识别和定位52种标准扑克牌（包括13个点数×4种花色）。系统在包含24,233张图像的数据集上进行了训练和验证，其中训练集21,203张，验证...
yolov8实现图集模型训练
2024-05-11 11:07

低调的小和和的博客 yolov8实现图片训练
【超详细教学】叫你如何使用YOLOv8训练自己的数据集！（含代码 + 实战 + 教程）
2025-05-02 09:48

空间机器人的博客自己训YOLOv8不难，关键在数据集干净 + 标注准确 + 参数合理，一套跑通你就能秒杀市面上八成文章！
基于Yolov4代码，训练自己标注的数据集，并测试图片对结果进行检测展示
2024-04-28 19:12

自由远方的博客 voc_annotation.py里面有一些参数需要设置，第一次训练可以仅修改classes_path，这个参数应该指向您存放 VOC 数据集的根目录。建立一个txt文件，写自己所需要区分的类别，classes_path用于指向检测类别所对应的txt，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月9日

码龄粉丝数原力等级 --

Yolov3：win10下训练自己的数据（整理图集遇到问题）

4条回答默认最新

码龄粉丝数原力等级 --

一、问题分析

1. 标注信息被清空的原因

2. 没有生成 `2025_train.txt` 和 `2025_val.txt` 的原因

二、解决方案

1. 修改 `voc_labels.py` 文件以确保正确生成文件

修改后的代码如下：

三、重点问题说明

1. 文件路径问题

2. 文件覆盖问题

3. 权限问题

四、验证步骤

五、总结

问题事件

码龄粉丝数原力等级 --

码龄粉丝数原力等级 --

码龄粉丝数原力等级 --

Yolov3：win10下训练自己的数据（整理图集遇到问题）

4条回答 默认 最新

一、问题分析

1. 标注信息被清空的原因

2. 没有生成 2025_train.txt 和 2025_val.txt 的原因

二、解决方案

1. 修改 voc_labels.py 文件以确保正确生成文件

修改后的代码如下：

三、重点问题说明

1. 文件路径问题

2. 文件覆盖问题

3. 权限问题

四、验证步骤

五、总结

问题事件

4条回答默认最新

2. 没有生成 `2025_train.txt` 和 `2025_val.txt` 的原因

1. 修改 `voc_labels.py` 文件以确保正确生成文件