人群计数数据集UCF-QNRF标注问题

人群计数数据集UCF-QNRF，验证图片标注，发现部分有问题。
比如0087这张图片，宽度是3648，但是标注文件中出现了大量的超过宽度的x坐标。如图所示。

有一部分图片标注是这样的，其他的正常。数据集是从官网下载的，4个多G。
请问，这个数据集就是这样的么？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2025-11-30 11:01
关注
上午好☀️☀️☀️️
本答案参考通义千问

你提到的 UCF-QNRF 数据集是一个广泛用于人群计数任务的经典数据集，包含大量真实场景下的图像及其对应的点标注（point annotations）。然而，你发现的部分图片中存在标注坐标超出图像边界的问题，确实可能是个别图片或标注文件中的异常情况。

✅ 一、UCF-QNRF 数据集简介

UCF-QNRF 是由 University of Central Florida 提供的一个大型人群计数数据集，包含：

1500 张图像
约 12,000 个标注点
图像分辨率：3648 × 2432 像素（即宽度为 3648）

每个图像对应一个 .txt 文件，其中每一行表示一个人的坐标（x, y），以像素为单位。

✅ 二、你遇到的问题分析

你提到在 0087.jpg 图片中，有多个标注点的 x 坐标超过了 3648，这显然超出了图像的实际宽度。

📌 可能原因如下：

标注错误

部分标注点可能是手动输入时出错，导致 x 值超过图像尺寸。
有些标注点可能是误标，比如将“宽”和“高”混淆了。

数据集中个别图片存在异常

UCF-QNRF 虽然整体质量较高，但并非所有图片都完美无缺，可能存在个别异常标注。

标注文件格式问题

某些 .txt 文件中可能包含非数字字符或格式错误，导致解析时读取到无效值。

✅ 三、解决方案

🔧 1. 验证并修复标注文件

步骤一：检查标注文件中的坐标范围

你可以编写脚本遍历所有 .txt 文件，检查每行的 x 和 y 坐标是否在图像范围内（0 ≤ x < 3648, 0 ≤ y < 2432）。

import os def validate_annotations(image_width=3648, image_height=2432): base_dir = "path/to/your/UCF-QNRF/Annotations" # 替换为你的标注目录 for filename in os.listdir(base_dir): if filename.endswith(".txt"): file_path = os.path.join(base_dir, filename) with open(file_path, 'r') as f: lines = f.readlines() for i, line in enumerate(lines): try: x, y = map(int, line.strip().split()) if x < 0 or x >= image_width or y < 0 or y >= image_height: print(f"Invalid annotation in {filename} at line {i+1}: ({x}, {y})") except ValueError: print(f"Invalid format in {filename} at line {i+1}: {line}")

步骤二：过滤掉超出范围的标注点

你可以修改上述脚本，将无效标注点移除或标记为无效。

def clean_annotations(input_dir, output_dir, image_width=3648, image_height=2432): if not os.path.exists(output_dir): os.makedirs(output_dir) for filename in os.listdir(input_dir): if filename.endswith(".txt"): input_path = os.path.join(input_dir, filename) output_path = os.path.join(output_dir, filename) with open(input_path, 'r') as fin, open(output_path, 'w') as fout: for line in fin: try: x, y = map(int, line.strip().split()) if 0 <= x < image_width and 0 <= y < image_height: fout.write(line) except: pass # 忽略格式错误的行

🔧 2. 手动检查和修正

如果你发现某些图片的标注严重错误，可以：

手动打开图像和对应的 .txt 文件，查看哪些点明显在图像外。
删除或修正这些点，确保最终标注文件准确。

🔧 3. 使用工具辅助验证

你可以使用以下工具进行批量验证：

Python 脚本（如上）
图像标注工具（如 LabelImg、VIA 等），用于可视化标注点是否正确。

✅ 四、UCF-QNRF 数据集是否正常？

答案是：大部分情况下是正常的，但个别图片可能存在标注错误。

UCF-QNRF 是一个高质量的数据集，绝大多数标注是正确的。
但正如你所发现的，个别图片的标注文件中确实存在异常点，这可能是由于人工标注时的疏忽或数据处理过程中的错误。

✅ 五、建议

建议你对整个数据集进行自动化校验，确保标注点都在图像范围内。
如果你打算用于训练模型，务必清理这些异常标注点，否则会影响模型性能。
如果你希望分享你的清理结果，也可以考虑发布一个经过清洗后的版本，帮助其他研究者。

✅ 六、总结

| 问题 | 解决方案 | |------|----------| | 标注点超出图像范围 | 编写脚本验证并清理 | | 标注文件格式错误 | 自动过滤非法行 | | 数据集整体质量 | 大部分正常，但需注意个别异常 |

如果你需要我提供完整的清洗代码或进一步解释某一部分，请告诉我！
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

主流人群计数数据集深度解析：从ShanghaiTech到UCF-QNRF
2026-03-23 00:14

weixin_30374009的博客本文深度解析主流人群计数数据集，包括ShanghaiTech、NWPU-Crowd、JHU_CROWD++和UCF-QNRF，提供技术选型指南和实战技巧。针对不同场景需求，如极端密度变化、复杂天气条件和超高分辨率挑战，详细分析各数据集特点及...
人群计数中常用数据集的总结以及使用方式（Python/PyTorch）
2025-04-15 14:19

Keep_Trying_Go的博客本文主要是对人群计数中常用的数据集的相关介绍以及使用方式，之所以特意的抽时间来写这篇博文，主要是最近发现比较多的小伙伴（刚进入这个领域）在人群计数数据集上容易迷茫。如果一个一个的为大家进行解答的话，还...
人群计数-python生成人群密度图
2020-08-28 12:07

极骇的博客这里我们采用UCF-QNRF_ECCV18的图片作为训练集，如下图所示。 ground_truth数据集是由mat文件组成的，数据格式为[y0,x0](不同数据集表示的方法不同)表示人头所在的像素点。利用scipy函数即可读取数据。加载...
行人检测数据集
2021-06-28 15:41

等待破茧的博客行人检测数据集 行人检测( Pedestrian Detection) 是计算机视觉领域内应用比较广泛和比较热门的算法，一般会与行人跟踪，行人重识别等技术进行结合，来对区域内的行人进行检测识别跟踪，广泛应用于安防，零售等领域...
行人重识别与人群计数数据集大盘点：推动智能监控研究的利器
2024-08-30 17:37

VLer.cn的博客关注公众号，发现CV技术之美本文转自趋动云。行人重识别（Person re-...旨在弥补固定的摄像头的视觉局限，并可与行人检测/行人跟踪技术相结合，可广泛应用于智能视频监控、智能安保等领域。本文将分享一些行人重...
密集人群检测与计数论文与开源数据
2019-12-24 16:49

wanghua609的博客由于一些较早的方法和数据集主要关注单场景计数，Zhang等人引入了一个数据集（cross-scene crowd counting via deep convoulutional neural networks),用于跨场景人群计数。作者试图进行数据驱动的跨场景人群计数，...
人群计数数据集汇总和详细介绍,全网最全，crowd counting datasets
2023-04-28 18:37

德彪稳坐倒骑驴的博客视频监控=video surveillancehttps://github.com/gjy3035/Awesome-Crowd-Counting/blob/master/src/Datasets.md进展 | 密集人群分布检测与计数 :https://www.sohu.com/a/338406719_823210。
主流人群计数数据集深度解析：从ShanghaiTech到JHU_CROWD++
2025-08-05 01:43

view3的博客本文深度解析了主流人群计数数据集，从经典的ShanghaiTech到规模庞大的NWPU-Crowd，再到标注精细的JHU_CROWD++。文章指出，选择与任务匹配的数据集是模型成功的关键，并详细分析了各数据集的特性、适用场景与挑战，...
人群计数实战数据集精选：从入门到精通的资源指南
2025-07-15 22:35

人间清醒863的博客文章深度剖析了UCF-QNRF、ShanghaiTech、JHU-CROWD++等经典及最新数据集的核心特点与适用场景，并提供了根据项目需求选择数据集的决策流程与实战技巧。掌握这些数据集资源，是提升人群计数模型从入门到精通的关键。
5个实战必备的人群计数数据集推荐（附下载与使用技巧）
2025-10-11 05:09

kiwi8的博客本文深入解析了5个实战必备的人群计数数据集，包括ShanghaiTech、UCF-QNRF、Mall Dataset等，并提供了详细的选型指南、下载链接与核心使用技巧。针对不同应用场景（如安防监控、客流统计），文章指导如何根据密度、...
5个超实用的人群计数数据集推荐（附下载链接与使用心得）
2025-09-08 01:13

o4p5q6r7s的博客本文为算法工程师和研究人员精选并深度解析了5个实战级人群计数数据集，包括JHU-CROWD++、GCC、ShanghaiTech和UCF-QNRF等。文章提供了每个数据集的核心特点、适用场景、使用心得及下载指引，并分享了评估数据集质量...
人群计数----Distribution Matching for Crowd Counting
2020-12-29 14:19

Provence22的博客在人群计数中，每个训练图像包含多个人物，每个人都用一个点来注释。现有的人群计数方法需要使用高斯平滑每个注释点，或者估计给定注释点的每个像素的可能性。在本文中，我们证明了对注释强加高斯分布会损害泛化性能...
江大白 | 高密度人群计数算法，苏大发布VMambaCC，既要全局感受野，也要推理速度！
2024-05-21 21:26

双木的木的博客在本研究中，作者引入了VMamba并提出了一个创新的人群计数模型VMambaCC。这个计数模型在人群计数背景下具有全局感受野和线性增长的计算复杂性。本研究设计了一种新的注意力机制MHF。MHF利用高级语义来指导低级语义...
CV笔记：图片数据处理
2022-11-28 11:29

X-ocean的博客人群计数数据处理
人群计数与行人检测数据集全解析(附下载指南)
2026-02-20 00:10

苏澄宇的博客本文全面解析了人群计数与行人检测领域的核心公开数据集，包括ShanghaiTech、UCF-QNRF、JHU-CROWD++等，详细对比了其特点、适用场景及挑战。文章提供了实用的数据集下载指南、预处理标准化流程（如标注格式转换与...
开源目标检测数据集汇总
2024-06-08 08:25

FL1623863129的博客计算机视觉中关于图像识别有四大类任务：...分类问题：即图片（或某个区域）中的图像属于哪个类别。定位问题：目标可能出现在图像的任何位置。大小问题：目标有各种不同的大小。形状问题：目标可能有各种不同的形状。
论文CrowdCLIP（基于CLIP的无监督人群计数模型）详解（PyTorch,Pytorch_Lighting）
2025-05-10 15:41

Keep_Trying_Go的博客而本文CrowdCLIP主要是从完全无监督的方向来进行研究的，两篇论文都从不同的角度去提升人群计数模型的性能，采用更新颖的方法做研究，这对于人群统计算法的拓展很有帮助，因为当前的人群统计算法基本把所有能用的...
Python-人群计数相关资源列表
2019-08-11 07:16

其中，数据集是训练和验证模型的关键，常见的有UCF-QNRF、ShanghaiTech A & B、COCO等，这些数据集提供了大量标注了人数的图像，可用于训练和评估模型。在模型架构方面，有些研究者设计了专门针对人群计数的网络...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月30日

人群计数数据集UCF-QNRF标注问题

2条回答 默认 最新

✅ 一、UCF-QNRF 数据集简介

✅ 二、你遇到的问题分析

📌 可能原因如下：

✅ 三、解决方案

🔧 1. 验证并修复标注文件

步骤一：检查标注文件中的坐标范围

步骤二：过滤掉超出范围的标注点

🔧 2. 手动检查和修正

🔧 3. 使用工具辅助验证

✅ 四、UCF-QNRF 数据集是否正常？

✅ 五、建议

✅ 六、总结

问题事件

2条回答默认最新