VOC转成JSON有问题，不知从何追溯的keyerror

求解答：跑detr模型出现了“keyerror：'r' ”的问题，出问题的代码段在哪里？？而且还有一个问题是：运行了VOC转JSON之后，.json文件中的filename还发生了变化？
首先阐述第二个问题的具体情况：
在我运行了VOC转JSON的代码后，.json文件中的文件名filename与.xml不一致，具体的表现为：
.json:

.xml:

就是最后的_600变成了_256，我不知道为啥会减掉4
具体代码如下，检查了也没切片操作啊，为啥（？）

def get(root, name):
    vars = root.findall(name)
    return vars

def get_and_check(root, name, length):
    vars = root.findall(name)
    if len(vars) == 0:
        raise NotImplementedError('Can not find %s in %s.' % (name, root.tag))
    if length > 0 and len(vars) != length:
        raise NotImplementedError('The size of %s is supposed to be %d, but is %d.' % (name, length, len(vars)))
    if length == 1:
        vars = vars[0]
    return vars


def get_filename_as_int(filename):
    try:
        filename = os.path.splitext(filename)[0]
        return filename
    except:
        raise NotImplementedError('Filename %s is supposed to be an integer.' % (filename))


# xml_list为xml文件存放的txt文件名    xml_dir为真实xml的存放路径    json_file为存放的json路径
def convert(xml_list, xml_dir, json_file):
    list_fp = open(xml_list, 'r')
    json_dict = {"images": [], "type": "instances", "annotations": [],
                 "categories": []}
    categories = PRE_DEFINE_CATEGORIES
    bnd_id = START_BOUNDING_BOX_ID
    for line in list_fp:
        line = line.strip()
        line = line + ".xml"
        print("Processing %s" % (line))
        xml_f = os.path.join(xml_dir, line)
        tree = ET.parse(xml_f)
        root = tree.getroot()
        path = get(root, 'path')
        if len(path) == 1:
            filename = os.path.basename(path[0].text)
        elif len(path) == 0:
            filename = get_and_check(root, 'filename', 1).text
        else:
            raise NotImplementedError('%d paths found in %s' % (len(path), line))
        ## The filename must be a number
        image_id = get_filename_as_int(filename)
        size = get_and_check(root, 'size', 1)
        width = int(get_and_check(size, 'width', 1).text)
        height = int(get_and_check(size, 'height', 1).text)
        image = {'file_name': filename, 'height': height, 'width': width,
                 'id': image_id}
        json_dict['images'].append(image)

出现keyerror'r'的错误报告如下，这个错也不知道从何纠起

Traceback (most recent call last):
  File "C:\Githouse\detr-main\detr-main\main.py", line 247, in <module>
    main(args)
  File "C:\Githouse\detr-main\detr-main\main.py", line 195, in main
    train_stats = train_one_epoch(
  File "C:\Githouse\detr-main\detr-main\engine.py", line 28, in train_one_epoch
    for samples, targets in metric_logger.log_every(data_loader, print_freq, header):
  File "C:\Githouse\detr-main\detr-main\util\misc.py", line 223, in log_every
    for obj in iterable:
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\torch\utils\data\dataloader.py", line 630, in __next__
    data = self._next_data()
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\torch\utils\data\dataloader.py", line 1344, in _next_data
    return self._process_data(data)
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\torch\utils\data\dataloader.py", line 1370, in _process_data
    data.reraise()
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\torch\_utils.py", line 706, in reraise
    raise exception
KeyError: Caught KeyError in DataLoader worker process 0.
Original Traceback (most recent call last):
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\torch\utils\data\_utils\worker.py", line 309, in _worker_loop
    data = fetcher.fetch(index)  # type: ignore[possibly-undefined]
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\torch\utils\data\_utils\fetch.py", line 52, in fetch
    data = [self.dataset[idx] for idx in possibly_batched_index]
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\torch\utils\data\_utils\fetch.py", line 52, in <listcomp>
    data = [self.dataset[idx] for idx in possibly_batched_index]
  File "C:\Githouse\detr-main\detr-main\datasets\coco.py", line 27, in __getitem__
    img, target = super(CocoDetection, self).__getitem__(idx)
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\torchvision\datasets\coco.py", line 53, in __getitem__
    image = self._load_image(id)
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\torchvision\datasets\coco.py", line 41, in _load_image
    path = self.coco.loadImgs(id)[0]["file_name"]
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\pycocotools\coco.py", line 227, in loadImgs
    return [self.imgs[id] for id in ids]
  File "C:\Users\15022\anaconda3\envs\detr\lib\site-packages\pycocotools\coco.py", line 227, in <listcomp>
    return [self.imgs[id] for id in ids]
KeyError: 'r'

ai出来说是主要是这个 File "C:\Githouse\detr-main\detr-main\datasets\coco.py", line 27, in getitem ？
打印出来的idx确实有'r'，可是不知道哪来的？究竟怎么溯源找到错误源头？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
一轮明月照丘壑 2024-09-20 22:28
关注
以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

针对你的问题，我们可以从以下几个方面进行分析和解决：

1. 关于VOC转JSON后文件名变化的问题

从你提供的代码和描述来看，你在转换VOC到JSON的过程中对文件名进行了处理。但是，处理逻辑中有一处可能会引发问题，就是在处理path和filename时。由于你的代码中处理了两种方式来获取filename，当path存在多个时可能会出现问题，引发错误或文件名变化。

具体来说，这段代码：

path = get(root, 'path') if len(path) == 1: filename = os.path.basename(path[0].text) elif len(path) == 0: filename = get_and_check(root, 'filename', 1).text else: raise NotImplementedError('%d paths found in %s' % (len(path), line))

你需要确保path元素只有一个或者没有，否则会尝试从filename获取文件名。这部分代码可能需要更详细的错误处理和逻辑检查来确保文件名的准确性。此外，还需要检查XML文件的结构和内容是否正确。

2. 关于KeyError的问题

这个错误出现在处理COCO数据集时。从错误信息来看，问题在于尝试访问字典中的'r'键，但该键不存在。这个'r'键可能来源于你的数据集中某个图像的ID或者其他与数据相关的键。你可能需要检查以下几点来追溯错误源头：

数据源: 检查你的COCO数据集是否有'r'这个键，以及它的来源是什么。可能是在数据预处理阶段或者数据加载阶段出现了问题。
数据加载器: 检查你的数据加载器（如CocoDetection类）是否正确加载了图像和标注信息。特别是涉及图像ID的部分，确保它们与数据集中的键对应正确。
自定义处理逻辑: 如果你对数据进行了任何自定义处理（例如调整ID等），请检查这部分逻辑是否引入了额外的键或修改了现有键的值。
打印调试信息: 在涉及到数据的部分添加打印语句，输出具体的图像ID和其他相关信息，以帮助你定位问题。例如，在数据加载器的__getitem__方法中打印出加载的图像ID和对应的标注信息。这样可以帮助你找到引起错误的图像和数据条目。

总的来说，这两个问题都与数据处理和加载有关。建议首先仔细检查你的数据处理逻辑和数据源，然后逐步跟踪代码以找到引发问题的具体位置。如果可能的话，提供更详细的代码和数据结构信息将有助于更准确地定位问题。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

pytorch point源代码出现KeyError: Caught KeyError in DataLoader worker process 0.如何解决？人工智能机器学习深度学习
2020-06-29 14:45

回答 2 已采纳 https://blog.csdn.net/qinglingLS/article/details/104411589
yolov5训练voc2007 python
2022-08-05 17:33

回答 2 已采纳最后通过朋友帮助，发现batch_size的大小会影响到训练的收敛效果。解决方法：batch_siz最初设置为4改为batch_siz=8就可以了
求VOC-360的数据集，谁下载过吗深度学习目标检测计算机视觉
2022-03-02 20:42

回答 1 已采纳下载2007年的训练数据wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar 下载2007年的
媒体上排名前200的JavaScript文章（至2017年1月）
2017-09-09 19:45

dfsgwe1231的博客我现在的工作重点是在编程语言方面，我在冬天从报废的媒介中浏览了600万篇文章。上次我发布了标记为Python的TOP 100文章。在媒体上排名前100的Python文章（至2017年1月）到2017年1月，在367。总阅读时间… ...
coco数据集和voc数据集目标检测
2022-10-08 15:16

回答 1 已采纳格式没有影响，关键是精度有影响，你看下你转成coco的时候有没有对原来的浮点数进行取整操作
如何在Postgres中将元素添加到JSON字段数组 postgresql
2019-03-29 07:27

回答 1 已采纳 You cannot use query parameters within a string in Postgres. Either pass the entire string to Post
关于pytorch网站上官方实现fcn网络的问题 pytorch 深度学习
2022-04-11 11:22

回答 1 已采纳低版本可手动安装，是否兼容可自行尝试 path '/data/VOCdevkit\VOC2012' does not exist. 报错是文件位置不对，你已经找到在哪里改了，可将--data-path
YOLOX 与bytetrack 训练权重能否共用的问题 python 目标跟踪计算机视觉
2022-09-15 19:08

回答 1 已采纳 ?权重公用不是你简单的CV复制就行。1.首先就是网络结构是否一致，网络模块参数是否一致，这些不一样的话是不能直接CV复制过去就行的。2.用的检测器是yolox，那就是检测器部分可以权重共用，但是检测器
Runtime Error：尺寸不匹配 python pytorch 深度学习
2022-01-21 15:04

回答 1 已采纳维度不匹配。他希望你该层的输入为[32, 512, 38, 38]，32位batch size，512为通道数，后面两位是H和W，但是你的卷积之后的通道数在该层只有64通道，16 batch size
调试DeFRCN代码出现的问题 pytorch 图像处理目标检测
2022-08-08 20:31

回答 2 已采纳你这是压根没有那个pth的路径，你得看看你的pth放在哪里的如果你发现实际上是有，那我建议用绝对路径别用相对路径
yolov5在跑train.py遇到的问题 python 深度学习目标检测
2022-05-08 16:54

回答 2 已采纳路径不对呗，你这么放置数据集的话，应该是: train: coco128/coco128/images/train1207 val: coco128/coco128/images/val1207
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月20日

悬赏问题

¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见
¥15 一共有五道问题关于整数幂的运算还有房间号码还有网络密码的解答？(语言-python)
¥20 sentry如何捕获上传Android ndk 崩溃
¥15 在做logistic回归模型限制性立方条图时候，不能出完整图的困难
¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动，如何解决？

VOC转成JSON有问题，不知从何追溯的keyerror

1条回答 默认 最新

1. 关于VOC转JSON后文件名变化的问题

2. 关于KeyError的问题

问题事件

悬赏问题

1条回答默认最新