kaist双模态融合数据集train和test差异过大

使用yolov5训练，使用的是train02和test20的split方式（直接从论文里down下来的数据集抽帧结果）

出现的问题是train-val（9：1划分的trian）时val结果在recall和map上都能到达0.95以上，但是在test20上只有0.7的recall和map，不清楚是哪里出了问题，难道是train和test的差异过大吗？

我想问一下各位朋友有遇到这样的情况吗？是这个数据集的train和test差异过大吗？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

YOLO 双 Backbone 双模态融合：以 LLVIP 数据集为例的红外 - 可见光目标检测实践
2025-11-17 17:25

一勺汤的博客通过分析LLVIP数据集的特点，指出可见光图像在夜间存在噪声和模糊问题，而红外图像能保持结构特征但缺乏语义信息。研究设计了三种特征融合方式：简单拼接、加权融合和跨模态注意力机制，其中注意力机制表现最佳。...
YOLO多模态融合目标检测实战
2025-04-19 10:14

喜欢编程就关注我的博客本文介绍了YOLO多模态融合目标检测的实战指南，包括数据集准备、模型选择与配置、特征融合策略、训练与评估以及实战技巧与注意事项。通过代码和表格示例的深入分析，帮助读者更好地理解和掌握YOLO多模态融合目标检测...
YOLOv5训练KAIST数据集
2021-10-15 15:06

胖刺客阿七的博客 YOLOv5目前比较火热，因此模型下载和使用不再赘述，网上资源很多，该文章主要是介绍如何将KAIST数据集处理成YOLOv5可以使用的格式。一、数据获取 1.KAIST数据集介绍： KAIST 行人数据集中的每张图片都由一张可见光...
【YOLO 项目实战】（12）红外/可见光多模态目标检测
2024-12-31 14:25

youcans的博客红外/可见光目标检测数据集包含可见光（RGB）图像和红外（IR）图像两个模态。本文讨论前端融合，将可见光图像和红外图像进行通道的合并（Marge），得到 6通道的图像（特征向量），送入 YOLOv8 模型进行训练。
YOLOFuse KAIST数据集复现实验
2026-01-01 15:22

偏偏无理取闹的博客基于Ultralytics YOLO构建的YOLOFuse框架，通过RGB-红外双流融合实现高效行人检测，支持多种融合策略与轻量化部署，结合KAIST数据集验证，显著提升复杂环境下的检测鲁棒性，降低标注成本并简化工程落地流程。
【深度估计 Depth Estimation】数据集介绍
2025-05-20 17:53

人类发明了工具的博客下载链接总览 数据集 发布年份任务数据模态样本/场景数量划分 (Train / Val / Test) 说明 KITTI Depth Completion 2017 深度补全、单目深度预测 RGB 图像 + 稀疏 LiDAR 深度 93 000 训练；1 000 验证；1 000 ...
YOLOFuse冒充红外数据技巧：单模态用户临时测试方案
2026-01-01 16:07

张天筝的博客在缺乏红外数据时，YOLOFuse允许将RGB图像复制为伪红外输入，实现双模态流程的完整验证。该方法不追求性能提升，而是确保模型架构与数据管道正确运行，为后续真实多模态训练铺平道路。通过简单的目录复制和配置调整...
可见光+红外数据集（已处理，YOLO可直接训练）
2023-12-08 00:08

Dneccc的博客可见光+红外双模态数据集
最全高质量大模型 -偏好数据集（10/12号已更新）
2024-09-15 19:06

数据猎手小k的博客大模型中的偏好数据集，就好比是给一个超级学霸特别定制的教材，这些教材里的内容都是这个学霸特别感兴趣或者特别擅长的。这样一来，学霸就能在这些领域里学得更快、更深入，而不是在所有科目上平均用力。简单来说...
《双模态检测系列二》：手把手教你将YOLO11改成双模态目标检测（红外+可见光图像，代码实战）
2024-11-11 20:21

Andrewuuuu的博客手把手带你改双模态目标检测网络，源码实战！
【数据集】20个红外目标检测数据集
2024-08-15 09:06

youcans的博客介绍了 20 个红外与可见光数据集，包括 FLIR、SCUT、LLVIP、M3FD、KAIST、TNO、INO、MSRS、BUTIV、OTCBVS 等，涉及行人检测、人脸识别、车辆检测等多个应用场景，给出了下载链接和相关论文。
YOLOFuse Waymo开放数据集接入测试
2026-01-01 15:21

EdTechIH的博客 YOLOFuse 将红外与RGB图像融合能力深度集成到YOLO生态，通过双流架构提升夜间目标检测性能。支持多种融合策略切换，配合预置容器镜像实现开箱即用，大幅降低部署门槛。标注复用机制减少人工成本，兼顾精度与效率，...
只有RGB数据能跑YOLOFuse吗？模拟红外数据的临时方案
2026-01-02 01:23

知乎机构号团队的博客在缺乏真实红外图像时，可通过复制RGB图像模拟双模态输入，验证YOLOFuse的完整流程。这种做法虽不体现模态互补，但能有效打通数据加载、模型训练与推理链路，是...待真实红外数据就绪后替换即可发挥多模态融合优势。
多模态图像融合实战：基于DAF-Net的红外与可见光优势互补架构解析
2025-11-07 16:46

芝士改变命运了吗的博客本文介绍了基于DAF-Net的红外与可见光图像融合技术，主要包括三个核心部分：首先阐述了DAF-Net的优势，它通过双分支特征提取和动态注意力融合机制实现多模态信息的互补增强；其次详细讲解了开发环境搭建和数据集准备...
YOLOFuse多尺度测试（MS Test）支持情况说明
2026-01-02 02:26

宁柳跨越的博客 YOLOFuse基于YOLOv8实现RGB-IR双模态检测，支持多尺度测试提升小目标召回，采用双流结构灵活融合，兼容原生API且无需红外标注。通过容器化部署和轻量化设计，适用于夜间监控、无人巡检等复杂环境，兼顾精度与效率。
最全具身智能数据集分享系列二 | 视觉语言动作（VLA）多模态模型数据集
2025-03-13 18:32

整数智能的博客 VLA是一类专门设计用于处理多模态输入的模型，通过结合视觉和语言处理，VLA 模型可以解释复杂的指令并在物理世界中执行动作。VLA模型的开发旨在应对具身智能中的指令跟随任务。
行人检测（3）——数据集
2020-04-11 16:54

_helen_520的博客 1.HOG+SVM使用的行人识别数据集 （1） INRIA Person Dataset（INRIA行人数据库）——可见光数据集，样本大小128*64 2. 红外行人数据集：KAISTMultispectral Pedestrain Detection Benchmark github地址：...
2024LLM领域热词大盘点：有哪些你还不知道的关键术语？
2025-01-23 09:00

AI大模型-大飞的博客我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得...
目标检测YOLO实战应用案例100讲-基于双模特征融合的目标检测（续）
2023-12-26 15:09

林聪木的博客第一个是FLIR红外数据集[51]，数据集共有7859张图像，划分为6287张训练图像和1572张测试图像，目标类别数为4。在训练过程中，使用SGD更新参数，动量参数设为0.9，BatchSize设为8，共训练 150个Epochs，初始学习率为...
YOLOFuseSegmentFault思否问答互动
2026-01-02 00:21

体制教科书的博客 YOLOFuse基于Ultralytics YOLO框架，实现RGB与红外图像的高效融合检测，支持多种融合策略，兼顾精度与部署效率。通过模块化设计和生态兼容性，显著降低多模态模型开发门槛，适用于夜间监控、应急搜救等复杂场景。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月2日

kaist双模态融合数据集train和test差异过大

使用yolov5训练，使用的是train02和test20的split方式（直接从论文里down下来的数据集抽帧结果）

出现的问题是train-val（9：1划分的trian）时val结果在recall和map上都能到达0.95以上，但是在test20上只有0.7的recall和map，不清楚是哪里出了问题，难道是train和test的差异过大吗？

我想问一下各位朋友有遇到这样的情况吗？是这个数据集的train和test差异过大吗？

0条回答 默认 最新

问题事件

0条回答默认最新