qq_53893977 2024-09-21 15:37 采纳率: 41.7%
浏览 3

mmdetection 下yolox训练结果异常

mmdetection框架下使用yolox模型进行训练loss_cls,loss_bbox一直为0,但是使用faster-rcnn训练的话训练结果没什么问题
yolox结果:
09/21 15:27:47 - mmengine - INFO - Epoch(train) [1][ 50/525] base_lr: 3.6281e-06 lr: 3.6281e-06 eta: 7 days, 4:26:52 time: 3.9429 data_time: 0.5973 memory: 4758 loss: 611.2113 loss_cls: 0.0000 loss_bbox: 0.0000 loss_obj: 611.2113
faster-rcnn结果:
9/21 15:15:12 - mmengine - INFO - Epoch(train) [1][ 50/4200] lr: 2.4775e-04 eta: 1 day, 12:05:52 time: 1.2899 data_time: 0.2441 memory: 2970 loss: 1.2557 loss_rpn_cls: 0.6564 loss_rpn_bbox: 0.0919 loss_cls: 0.4992 acc: 97.8516 loss_bbox: 0.0083
该怎么调试?

  • 写回答

1条回答 默认 最新

  • 一轮明月照丘壑 2024-09-21 15:38
    关注

    以下回复参考:皆我百晓生券券喵儿等免费微信小程序作答:

    从你给出的训练结果来看,使用YOLOX模型训练时,loss_clsloss_bbox一直为0,这是非常异常的情况。通常,在训练过程中,这些损失值会不断下降并有一定的波动。以下是一些建议的调试步骤:

    1. 检查数据: 确保你的训练数据集是正确的,并且已经正确加载到YOLOX模型中。确认标注文件是否正确对应到图片,以及标注的边界框是否完整且不含有错误的坐标值。
    2. 学习率设置: 虽然你的学习率似乎设置的并不高(基于给定的信息),但是你可能需要检查YOLOX的学习率是否与数据集和模型结构相匹配。也许你可以尝试调整学习率或者优化器参数来看看训练是否开始收敛。但请确保更改的参数不会导致其他问题。
    3. 初始化问题: 确保YOLOX模型的权重没有被破坏或者意外更改。重新下载一个新的预训练权重进行尝试可能是一个好主意。如果是从旧的实验中断继承的训练结果导入,检查保存的模型文件是否完整无误。
    4. 日志信息: 你提到的训练日志中的信息可能不全。考虑检查其他日志信息或输出,看是否有任何异常或错误提示。这可能会提供关于问题的线索。
    5. 模型配置: 检查YOLOX的配置文件是否与你的任务和环境相匹配。特别是那些关于数据集输入和预处理的部分。确认配置文件的参数是否与数据集和任务的预期匹配。
    6. 环境依赖: 确认你的Python环境中的所有依赖项都已正确安装并且是最新版本,特别是PyTorch和相关库如mmdetection和mmcv等。
    7. 模型状态与错误累积: 由于loss一开始就一直为0而没有降低,可能之前的一些错误累积导致了这个问题。考虑清理工作目录中的临时文件和日志,然后重新开始训练看看是否有任何变化。
    8. 与官方代码对比: 可以尝试与官方的YOLOX代码或更早期的版本进行对比,看看是否有任何明显的差异导致这个问题。也可以考虑查阅相关的GitHub仓库或论坛,看看是否有其他用户遇到类似的问题及其解决方案。

    如果尝试了上述建议仍然无法解决问题,建议提供更详细的代码和环境信息以便进一步分析。

    评论

报告相同问题?

问题事件

  • 创建了问题 9月21日

悬赏问题

  • ¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
  • ¥50 浦育平台scratch图形化编程
  • ¥20 求这个的原理图 只要原理图
  • ¥15 vue2项目中,如何配置环境,可以在打完包之后修改请求的服务器地址
  • ¥20 微信的店铺小程序如何修改背景图
  • ¥15 UE5.1局部变量对蓝图不可见
  • ¥15 一共有五道问题关于整数幂的运算还有房间号码 还有网络密码的解答?(语言-python)
  • ¥20 sentry如何捕获上传Android ndk 崩溃
  • ¥15 在做logistic回归模型限制性立方条图时候,不能出完整图的困难
  • ¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动,如何解决?