利用voc_label.py生成的生成的验证集合和训练集合路径问题

利用voc_label.py生成的生成的验证集合和训练集合路径是一样的对吗

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join

sets=[('2025', 'train'), ('2025', 'val')]

classes = ["Shu"]


def convert(size, box):
    dw = 1./size[0]
    dh = 1./size[1]
    x = (box[0] + box[1])/2.0
    y = (box[2] + box[3])/2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)

def convert_annotation(year, image_id):
    in_file = open('D:/YOLO/darknet-master/scripts/VOCdevkit/VOC%s/Annotations/%s.xml'%(year, image_id))
    out_file = open('D:/YOLO/darknet-master/scripts/VOCdevkit/VOC%s/labels/%s.txt'%(year, image_id), 'w')
    tree=ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
   
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
  
        if cls not in classes or int(difficult) == 1:
            continue
            break
        cls_id = classes.index(cls)   
        xmlbox = obj.find('bndbox')     
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w,h), b)     
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
        
wd = getcwd()

for year, image_set in sets:
    if not os.path.exists('D:/YOLO/darknet-master/scripts/VOCdevkit/VOC%s/labels/'%(year)):
        os.makedirs('D:/YOLO/darknet-master/scripts/VOCdevkit/VOC%s/labels/'%(year))
    image_ids = open('D:/YOLO/darknet-master/scripts/VOCdevkit/VOC%s/ImageSets/Main/%s.txt'%(year, image_set)).read().strip().split()
   # list_file = open('%s_%s.txt'%(year, image_set), 'w')
    list_file = open('D:/YOLO/darknet-master/scripts/VOCdevkit/VOC2025/ImageSets/Main/%s_%s.txt'%(year, image_set), 'w')

    for image_id in image_ids:
        print(image_id)
        #list_file.write('%sD:/YOLO/darknet-master/scripts/VOCdevkit/VOC%s/JPEGImages/%s.jpg\n'%(wd, year, image_id))
        list_file.write('D:/YOLO/darknet-master/scripts/VOCdevkit/VOC%s/JPEGImages/%s.jpg\n'%(year, image_id))
        convert_annotation(year, image_id)
    list_file.close()

2025_trian.txt下

2025_val.txt下

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2025-09-11 16:52
关注
下午好🌅🌅🌅
本答案参考通义千问

你提到的问题是关于使用 voc_label.py 脚本生成的训练集和验证集的路径是否一致。根据你提供的代码片段，我们可以分析并解决这个问题。

问题分析

从你的代码中可以看出：

你定义了 sets = [('2025', 'train'), ('2025', 'val')]
这意味着你正在处理一个名为 VOC2025 的数据集
在生成标签文件（.txt）时，脚本会将它们写入到 VOC2025/labels/ 目录下
在生成图像列表文件（如 2025_train.txt 和 2025_val.txt）时，你也指定了路径为 VOC2025/ImageSets/Main/

但是，在以下部分，你存在一个明显的路径错误：

list_file = open('D:/YOLO/darknet-master/scripts/VOCdevkit/VOC2025/ImageSets/Main/%s_%s.txt'%(year, image_set), 'w')

这个路径中，VOC2025 是一个固定的名称，而 year 是 '2025'，所以最终路径是：

D:/YOLO/darknet-master/scripts/VOCdevkit/VOC2025/ImageSets/Main/2025_train.txt D:/YOLO/darknet-master/scripts/VOCdevkit/VOC2025/ImageSets/Main/2025_val.txt

这说明：

训练集和验证集的路径是相同的，都是指向 VOC2025 文件夹下的 ImageSets/Main 目录

因此，训练集和验证集的路径确实是一样的，这是不合理的，因为通常我们希望训练集和验证集保存在不同的目录中以避免混淆。

解决方案

1. 明确区分训练集和验证集的路径

你应该确保训练集和验证集分别保存在不同的目录中。例如：

训练集：VOC2025/train/
验证集：VOC2025/val/

2. 修改路径配置

修改代码中的路径部分，确保 train 和 val 分别写入不同的文件夹。

3. 更新代码示例（修改后）

下面是修改后的代码段，重点部分已加粗：

# 定义 sets 为年份和集合类型（train / val） sets = [('2025', 'train'), ('2025', 'val')] # 类别列表 classes = ["Shu"] def convert(size, box): # ...（保持原样） def convert_annotation(year, image_id): # ...（保持原样） # 设置工作目录 wd = getcwd() for year, image_set in sets: # 创建 labels 文件夹（按 train/val 分类） labels_dir = f'D:/YOLO/darknet-master/scripts/VOCdevkit/VOC{year}/labels/{image_set}' if not os.path.exists(labels_dir): os.makedirs(labels_dir) # 指定图像列表文件路径（按 train/val 分类） list_file_path = f'D:/YOLO/darknet-master/scripts/VOCdevkit/VOC{year}/ImageSets/Main/{image_set}.txt' list_file = open(list_file_path, 'w') # 获取图像 ID 列表 image_ids = open(f'D:/YOLO/darknet-master/scripts/VOCdevkit/VOC{year}/ImageSets/Main/{image_set}.txt').read().strip().split() for image_id in image_ids: list_file.write(f'D:/YOLO/darknet-master/scripts/VOCdevkit/VOC{year}/JPEGImages/{image_id}.jpg\n') convert_annotation(year, image_id) list_file.close()

关键点总结

路径重复问题
原始代码中，train 和 val 的标签和图像列表都写入同一个目录（VOC2025/...），导致路径重复。

建议修改方向

使用 image_set 字段动态生成路径（如 train、val）
确保 labels 和 ImageSets 中的子目录独立

修改后的路径结构示例

D:/YOLO/darknet-master/scripts/VOCdevkit/VOC2025/ ├── JPEGImages/ ├── Annotations/ ├── labels/ │ ├── train/ │ └── val/ └── ImageSets/ └── Main/ ├── train.txt └── val.txt

结论

是的，训练集和验证集的路径原本是相同的，但通过修改路径逻辑，可以实现它们的路径分离。

如果你需要我进一步帮助你构建完整的 VOC 数据集结构或生成其他格式的数据，请告诉我！
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

YOLOv4 训练自己数据集
2024-04-27 20:23

特爱敲代码的博客它是YOLO算法系列的最新版本，由Joseph Redmon和Alexey Bochkovskiy于2020年发布。YOLOv4通过将整个图像划分为多个网格，并为每个网格预测边界框和类别，实现了实时高效的目标检测。与传统的目标检测算法相比，YOLOv...
python写xml文件制作目标检测_【目标检测实战】目标检测实战之一--手把手教你LMDB格式数据集制作！...
2021-01-29 10:42

储昭盛的博客文章目录1 目标检测简介2 lmdb数据制作2.1 VOC数据制作2.2 lmdb文件生成lmdb格式的数据是在使用caffe进行目标检测或分类时，使用的一种数据格式。这里我主要以目标检测为例讲解lmdb格式数据的制作。1 目标检测简介...
yolov5 从配置环境到自己训练数据集合
2022-12-23 19:21

Macre Aegir Thrym的博客四、配置模型 4.1 修改数据配置文件五、开始训练模型的使用六、检测效果 6.1 训练可视化 6.2 检测效果 **笔记思路和结构 ** 以项目部署的思路来写的一、配置anaconda 二、环境配置三、制作数据集合 ...
【GitHub开源项目实战】Detectron2 开源实战全解析：从模型训练到推理部署的目标检测工程路径
2025-05-10 19:01

观熵的博客 Detectron2 是由 Facebook AI Research 团队推出的下一代目标检测与图像分割平台，基于 PyTorch 实现，集成了包括 Faster R-CNN、Mask R-CNN、RetinaNet 在内的主流模型结构，并支持大规模数据集训练、推理与评估...
睿智的目标检测66——Pytorch搭建YoloV8目标检测平台
2023-05-15 00:13

Bubbliiiing的博客 3、利用Yolo Head获得预测结果三、预测结果的解码 1、获得预测框与得分 2、得分筛选与非极大抑制四、训练部分 1、计算loss所需内容 2、正样本的匹配过程 a、判断特征点是否在预测框中 b、判断特征点是否在真实框内...
【实战解析】YOLOv9全流程训练至优化终极指南
2024-04-08 10:36

Zhijun.li@Studio的博客 YOLOv9 引入了可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN)等开创性技术，标志着实时目标检测领域的重大进步。该模型在效率、准确性和适应性方面都有显著提高，在 MS COCO 数据集上树立了新的标杆。
睿智的目标检测61——Pytorch搭建YoloV7目标检测平台
2022-09-26 22:40

Bubbliiiing的博客 AB哥弄了个YoloV7，我觉得有...使用了创新的下采样结构，使用Maxpooling和步长为2x2的特征并行进行提取与压缩。2、加强特征提取部分：同主干部分，加强特征提取部分也使用了多输入堆叠结构进行特征提取，使用Maxpooli
无人驾驶虚拟仿真（十五）--障碍物检测与识别1
2022-04-05 21:23

溪风沐雪的博客简介：无人驾驶虚拟仿真环境中，道路障碍物默认有3种，路障、小鸭子（模拟行人）和小车，其中路障是静止状态，小鸭子和小车可以是静止状态，也可以是运动状态。障碍物色彩复杂多变、在道路中的位置随机且动态变化，...
YOLO系列最全指南！附赠YOLOv8训练技巧+工业级部署方案（限时领代码）
2025-04-24 23:38

博导YOLO君教程的博客在进行训练时，可以使用交叉验证的方法将训练集再次划分为训练子集和验证子集，用于模型的训练和验证。训练集是用于模型的训练的数据集。在训练过程中，模型使用训练集中的样本进行学习和参数调整，通过不断迭代优化...
从0开始实现目标检测——实践篇
2022-02-15 23:09

guohuang的博客根据上一篇《从0开始实现目标检测——原理篇》的讲述，我们选择了YOLOv3作为模型，那么本篇文章将继续接着上篇的内容，自己动手基于YOLOv3实现模型训练和mAP的计算。在自己动手的这个过程中，一边解决遇到的问题，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月11日

利用voc_label.py生成的生成的验证集合和训练集合路径问题

4条回答 默认 最新

问题分析

解决方案

1. 明确区分训练集和验证集的路径

2. 修改路径配置

3. 更新代码示例（修改后）

关键点总结

结论

问题事件

4条回答默认最新