Lu_Shen 2024-08-10 14:59 采纳率: 0%

已结题

yolov5中train过程中，第一次完整训练的验证过程中，图像处理尺寸和设置尺寸不一致(设置尺寸失效)的问题

针对数据集的训练过程中，1000个epoch的训练中，第一轮完整训练的最后一次验证部分中，针对图像的处理尺寸与val.run中设置的imgsz不对应.其中，train.py和val.py文件中的imgsz均设置为640,在调试中，训练过程的imgsz=640起到了作用,val设置的imgsz=640没有起到作用

该图显示了yolo.py运行对应模型的yaml文件所显示的结果，运行结果没有问题
其中主体模块MobileNetv3_BiMSDA，经过单独例子测试(即设置一个输入x(b,c,h,w)，经过该模块后，打印输出的形状和对应值)，确认模块在指定尺寸下运行时没有问题的,其中，该网络架构在特定尺寸的输入下(640*640)，每个模块经过调试后都是没有问题的.


nc: 7  # number of classes
depth_multiple: 1.0  # model depth multiple
width_multiple: 1.0  # layer channel multiple
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

# YOLOv5 v6.0 backbone
backbone:
  [[-1, 1, conv_bn_act, [16,2]],  # 0
   [-1, 1, MobileNetv3_BiMSDA, [16, 16, 3, 1, 0, 0]],  # 1
   [-1, 1, MobileNetv3_BiMSDA, [24, 64, 3, 2, 1, 0]],  # 2
   [-1, 1, MobileNetv3_BiMSDA, [24, 72, 3, 1, 0, 0]],  # 3

   [-1, 1, MobileNetv3_BiMSDA, [40, 72, 5, 2, 1, 0]],  # 4
   [-1, 1, MobileNetv3_BiMSDA, [40, 120, 5, 1, 0, 0]],  # 5
   [-1, 1, MobileNetv3_BiMSDA, [40, 120, 5, 1, 0, 0]],  # 6


   [-1, 1, MobileNetv3_BiMSDA, [80, 240, 3, 2, 1, 1]],  # 7
   [-1, 1, MobileNetv3_BiMSDA, [80, 200, 3, 1, 0, 1]],  # 8
   [-1, 1, MobileNetv3_BiMSDA, [80, 184, 3, 1, 0, 1]],  # 9
   [-1, 1, MobileNetv3_BiMSDA, [80, 184, 3, 1, 0, 1]],  # 10
   [-1, 1, MobileNetv3_BiMSDA, [80, 480, 3, 1, 0, 1]],  # 11

   [-1, 1, MobileNetv3_BiMSDA, [112, 672, 3, 1, 0, 1]],  # 12
   [-1, 1, MobileNetv3_BiMSDA, [112, 672, 5, 1, 0, 1]],  # 13

  ]
# YOLOv5 v6.0 head
head:
  [[-1, 1, Conv, [256, 1, 1]],  # 16
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],  
   [[-1, 13], 1, Concat, [1]],  # cat backbone P4
   [-1, 1, C3, [256, False]],  # 19

   [-1, 1, Conv, [128, 1, 1]],  # 20
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P3
   [-1, 1, C3, [128, False]],  # 23 (P3/8-small)

   [-1, 1, Conv, [128, 3, 2]],  # 24
   [[-1, 20], 1, Concat, [1]],  # cat head P4
   [-1, 1, C3, [256, False]],  # 26 (P4/16-medium)

   [-1, 1, Conv, [256, 3, 2]], # 27
   [[-1, 16], 1, Concat, [1]],
   [-1, 1, C3, [512, False]],  # 29 (P4/16-medium)

   [[23, 26, 29], 1, Detect, [nc, anchors]],
  ]

上即为模型的yaml文件

此为报错信息，打印y和对应残差连接中的identity的形状，观察训练中每一个batch_size中y和其identity的形状是否保持一致，在输入尺寸为640*640的情况下，训练过程是没有问题的

但在第一轮训练的末尾，进行验证时，发现输入图像的处理尺寸与val设置的imgsz=640不一致(卷积stride=2的情况下，尺寸缩小2倍，算出输入尺寸为(384,672))，因此没办法知道是val文件的哪里出了问题

        if RANK in [-1, 0]:
            # mAP
            callbacks.run('on_train_epoch_end', epoch=epoch)
            ema.update_attr(model, include=['yaml', 'nc', 'hyp', 'names', 'stride', 'class_weights'])
            final_epoch = (epoch + 1 == epochs) or stopper.possible_stop
            if not noval or final_epoch:  # Calculate mAP
                results, maps, _ = val.run(data_dict,
                                           batch_size=batch_size // WORLD_SIZE * 2,
                                           imgsz=imgsz,
                                           model=ema.ema,
                                           single_cls=single_cls,
                                           dataloader=val_loader,
                                           save_dir=save_dir,
                                           plots=False,
                                           callbacks=callbacks,
                                           compute_loss=compute_loss)

此为train.py中的关于验证部分的调用方法，其中val.run将参数进行装载,imgsz=imgsz表示图像的处理尺寸与train中--imgsz的参数设置保持相同，这里train.py中的imgsz默认设置=640，且此处将imgsz=640，验证结果也会出现同样的错误,即残差连接中，y和identity在第四个维度上的尺寸不一致，如前图所示。
如果是yolo.py的设置有问题，但在之前进行的一些关于MobileNetv3的模型测试中，并没有出现由于val文件参数错误出现过相关的问题，也没有出现过yolo.py文件参数设置导致出现的问题.且该问题在第一个完整训练过程的最后一轮，也就是第一次验证过程就报错，提示图像尺寸不一致的问题，说明val.run（）中的imgsz设置根本没有起到作用，或者说出现了奇怪的输入尺寸(384,672)而且不知道是从哪里来的.
希望大家能给出解决这个问题的方法和一些思路，谢谢！最好能给出出错的相关地方和补救措施，这对我真的很重要，谢谢各位！
如果有知道这个出错信息如何解决的大佬，请在评论区私聊我，因为关于核心代码的部分还是我个人独创的，且没有公开(用于学业),不方便在这里透露了，但明确的是，核心代码的功能测试和案例测试都是没有问题的，在yolo.py文件打印模型架构也是可以正常打印的.如果能解决这部分问题，真是非常感谢!

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

24条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-08-10 15:00
关注
参考免费微信小程序：皆我百晓生 作答，经由专家-皆知整理回复，如问题解决，望采纳；如仍有疑问，请评论回复。

根据您提供的信息，问题似乎出现在验证阶段 (val.run) 中，尽管您已经明确设置了 imgsz=640，但验证时图像处理尺寸却不符合预期，导致模型中的残差连接部分出现尺寸不匹配的错误。这可能是由于以下几个方面的原因造成的：

1. 检查val.py中的resize_images逻辑

确保 val.py 文件中的图像预处理函数正确地使用了 imgsz 参数。特别注意图像缩放或padding的逻辑，确保它们确实按照设定的 imgsz 处理图像。

def preprocess_image(img_path, imgsz): img = cv2.imread(img_path) img = letterbox(img, new_shape=(imgsz, imgsz))[0] # 确保这里或后续步骤使用了正确的imgsz ...

2. 检查验证集加载器 (val_loader) 的配置

验证集的数据加载器 (val_loader) 配置也需要检查，确保它在加载图像时没有覆盖 imgsz 设置。通常在PyTorch的DataLoader初始化中，可以通过 collate_fn 控制数据预处理逻辑，确保该逻辑与 imgsz 设置相符。

3. 模型内部尺寸调整逻辑

考虑到错误信息中提到的维度不匹配问题，可能是在模型内部的某些层（如上采样、下采样层）中，尺寸计算或处理逻辑与 imgsz 不一致。尤其是当涉及到动态尺寸变化（如步长为2的卷积）时，要确保这些操作后的尺寸计算逻辑正确考虑到了 imgsz 的影响。

4. 检查环境变量或外部依赖

有时候，问题可能来源于外部依赖库的版本不兼容或者环境变量设置。确保您的环境干净，所有依赖库（特别是与图像处理相关的，如OpenCV、Pillow等）都更新至最新或与Yolov5版本相匹配的版本。

5. Debugging建议

添加日志打印：在 val.py 的图像预处理和模型前向传播的关键位置加入打印语句，确认 imgsz 是否被正确传递并应用于图像尺寸调整。

print(f"Val imgsz set to: {imgsz}") # 在预处理后 print(f"Processed image shape: {img.shape}")

逐行调试：使用Python调试工具（如pdb）在验证阶段逐步执行，观察 imgsz 如何被应用，以及在哪个具体操作后尺寸开始不匹配。

6. 检查自定义代码

虽然您提到核心代码功能测试无误，但仍需注意自定义部分可能对图像尺寸处理有间接影响。重新审视这些自定义部分，特别是涉及图像尺寸处理的逻辑。

综上所述

首先从数据预处理和模型输入尺寸处理逻辑入手，通过细致的调试和日志记录定位问题所在。若以上步骤未能解决问题，可能需要更深入地审查您的自定义代码逻辑，或者考虑是否有其他环境因素干扰了尺寸处理流程。希望这些建议能帮助您找到并解决问题。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

目标检测：yolov5训练自己的数据集，新手小白也能学会训练模型，一看就会
2024-04-26 23:24

笑脸惹桃花的博客 yolov5训练起来较为简单，跟yolov8相差不多，如果有其他目标检测的数据集理论上可以直接拿来用，从第3训练模型开始看，新手小白0基础建议一步一步跟着来，哪里看不懂的或者遇到哪有问题可以评论区交流或者私信问~
目标检测：yolov8(ultralytics)训练自己的数据集，新手小白也能学会训练模型，一看就会
2024-04-09 11:39

笑脸惹桃花的博客很简单小白也可以轻松...yolov8训练起来较为简单，如果有其他目标检测的数据集理论上可以直接拿来用，从第3训练模型开始看，新手小白0基础建议一步一步跟着来，哪里看不懂的或者遇到哪有问题可以评论区交流或者私信问~
YOLOv5中使用torch加载模型进行目标检测
2025-12-16 13:41

马屿人的博客通过torch.hub.load加载本地训练好的YOLOv5模型，结合OpenCV实现实时目标检测，利用pandas处理检测结果并可视化标签与置信度，适用于自定义模型的快速部署与调试。
YOLOv8训练时如何设计锚框尺寸？
2025-12-31 17:36

媛源啊的博客针对YOLOv8训练中锚框不适配的问题，深入探讨基于K-means聚类的自适应锚框生成方法。通过分析真实标注分布，采用IoU距离度量进行聚类，提升模型收敛速度与检测精度，尤其改善小目标漏检和定位抖动问题，是定制化目标...
睿智的目标检测57——Tensorflow2 搭建YoloV5目标检测平台
2022-04-09 15:19

Bubbliiiing的博客睿智的目标检测57——Tensorflow2 搭建YoloV5目标检测平台学习前言源码下载YoloV5改进的部分（不完全）YoloV5实现思路一、整体结构解析二、网络结构解析1、主干网络Backbone介绍2、构建FPN特征金字塔进行加强特征...
超详细目标检测：YOLOv11(ultralytics)训练自己的数据集，新手小白也能学会训练模型，手把手教学一看就会
2024-10-31 15:28

笑脸惹桃花的博客 YOLOv11为Ultralytics公司YOLO系列实时目标检测器的最新迭代版本，训练流程与YOLOv8基本一致，仅替换了新的网络结构与预训练权重，如果有其他目标检测的数据集可以直接拿来用，从第3训练模型开始看，新手小白0基础...
YOLOv8训练参数调优指南：epochs、imgsz、batch size设置建议
2025-12-31 15:40

尴尬癌患者的博客深入解析YOLOv8中epochs、imgsz与batch size的协同影响，结合实际场景给出科学调参策略。从工业质检到边缘部署，揭示如何根据任务需求和硬件条件平衡精度与效率，避免常见训练陷阱。
睿智的目标检测66——Pytorch搭建YoloV8目标检测平台
2023-05-15 00:13

Bubbliiiing的博客 YoloV5最初使用了Focus结构来初步提取特征，在改进后使用了大卷积核的卷积来初步提取特征，速度都不快。YoloV7则使用了三次卷积来初步提取特征，速度也不快。YoloV8则使用普通的步长为2的3x3卷积核来初步提取特征...
rasberry pi 5 -auto license plate recognition-Chinese（树莓派5车牌自动识别），环境搭建，yolo训练部署，大一从零开始个人学习全过程
2025-03-27 20:39

ZFQ310的博客本文将从最开始的环境搭建开始，其中会...以下是本文目录：一、学习过程中的问题二、anaconda下载及环境搭建三、部分库和yolov5下载及其依赖安装四、yolov5数据集及训练五、yolov5部署及Paddleocr联合应用车牌识别。
YOLOv13教程：YOLOv13训练模型，超详细适合0基础小白快速上手
2025-07-11 13:48

笑脸惹桃花的博客小白也可以看懂的YOLOv13教程，零基础小白快速上手训练出自己的模型。
YOLOv8在电力巡检无人机中的缺陷识别应用
2025-12-31 16:06

艾古力斯的博客 YOLOv8凭借轻量高效、Anchor-free设计和强大泛化能力，成为电力巡检无人机缺陷识别的理想选择。结合Docker容器化部署与边缘计算平台，实现模型快速落地与稳定运行。通过真实场景训练、多尺度增强与TensorRT加速，可...
YOLOv8【第八章：特殊场景检测篇·第4节】一文搞懂，红外热成像目标检测！
2025-12-11 21:11

bug菌¹的博客本文收录于《YOLOv8实战：从入门到深度优化》专栏。该专栏系统复现并梳理全网各类 YOLOv8 改进与实战案例（当前已覆盖分类 / 检测 / 分割 / 追踪 / 关键点 / OBB 检测等方向），坚持持续更新 + 深度解析，质量分...
YOLOv8在工业质检中的实际应用场景案例分享
2025-12-31 15:53

恋爱大魔头的博客 YOLOv8凭借高效精准的检测能力，正广泛应用于PCB板焊点缺陷检测等工业场景。通过容器化部署和模型优化，实现稳定低延迟推理，结合数据闭环与业务规则，显著提升检测准确率并降低漏检率，推动智能制造升级。
使用yolov8第三次训练特殊天气下车辆识别
2025-12-22 22:35

哼唧兽的博客本文对比了YOLOv8m和YOLOv8n模型在目标检测任务中的表现。使用深瞳智检开源数据，包含6个类别共1027张图像（821训练/206验证）。结果显示，YOLOv8m（25.8M参数）在mAP50上达到0.626，优于YOLOv8n（3.0M参数）的0.533...
树莓派树莓派搭建深度学习环境、树莓派部署Yolov5-Lite模型相关流程
2025-09-25 10:09

郭庆汝的博客树莓派树莓派搭建深度学习环境、树莓派部署Yolov5-Lite模型相关流程
YOLOv8在智能交通卡口车牌识别中的高精度实现
2025-12-31 16:12

初雪CH的博客在复杂交通场景中，YOLOv8凭借其高效架构与强泛化能力，显著提升车牌检测的准确率与稳定性。通过多尺度融合、任务对齐分配器和数据增强策略，模型能有效应对遮挡、低光照等挑战。结合容器化部署与本地化训练，已在...
YOLOv改进 | 引入ICCV 2025中的ConvAttn卷积化注意力，以更轻量的方式模拟自注意力的效果
2025-10-23 19:06

鱼弦的博客该方法可无缝集成到YOLOv11的骨干网络、特征融合层或检测头中，在移动端实时检测、智能安防、工业质检和自动驾驶等场景中，有效解决传统卷积局部感受野不足和自注意力计算复杂度过高的问题。实验表明，该改进方案在...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 8月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金100元 8月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金20元 8月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月10日

码龄粉丝数原力等级 --

yolov5中train过程中，第一次完整训练的验证过程中，图像处理尺寸和设置尺寸不一致(设置尺寸失效)的问题

24条回答默认最新

码龄粉丝数原力等级 --

1. 检查`val.py`中的`resize_images`逻辑

2. 检查验证集加载器 (`val_loader`) 的配置

3. 模型内部尺寸调整逻辑

4. 检查环境变量或外部依赖

5. Debugging建议

6. 检查自定义代码

综上所述

问题事件

码龄粉丝数原力等级 --

码龄粉丝数原力等级 --

码龄粉丝数原力等级 --

码龄粉丝数原力等级 --

yolov5中train过程中，第一次完整训练的验证过程中，图像处理尺寸和设置尺寸不一致(设置尺寸失效)的问题

24条回答 默认 最新

1. 检查val.py中的resize_images逻辑

2. 检查验证集加载器 (val_loader) 的配置

3. 模型内部尺寸调整逻辑

4. 检查环境变量或外部依赖

5. Debugging建议

6. 检查自定义代码

综上所述

问题事件

24条回答默认最新

1. 检查`val.py`中的`resize_images`逻辑

2. 检查验证集加载器 (`val_loader`) 的配置