梦想是暴富 2024-09-13 15:20 采纳率: 42.9%
浏览 13

在训练yolov5的时候,为什么明明显示成功调用gpu,但是实际GPU并没有在工作

以下是我安装的cuda\pytorch的版本,应该是没什么问题的吧,训练的时候也是显示成功调用了,但是不知道为什么就是跑不起来,而且都不是慢,他就是一直不动,找了好久没找到解决办法,希望有datui帮忙解决!

img

img

img

img

img

  • 写回答

2条回答 默认 最新

  • 一轮明月照丘壑 2024-09-14 09:31
    关注

    以下回复参考:皆我百晓生券券喵儿等免费微信小程序作答:

    从你给出的内容来看,你遇到的问题可能是关于YOLOv5训练时GPU没有充分利用或者没有运行的问题。以下是一些建议和可能的解决方案:

    1. 确认GPU是否被正确识别

      • 你已经提到了CUDA版本和NVIDIA驱动版本,这表明你的系统应该可以识别GPU。但是,确保CUDA和cudnn版本与你的PyTorch和YOLOv5版本兼容。
    2. 检查YOLOv5的版本

      • 确保你使用的YOLOv5版本与你的PyTorch版本兼容。有时,新版本的YOLOv5可能需要更高版本的PyTorch。
    3. 检查训练数据

      • 确保你的训练数据路径正确,并且数据格式正确。任何数据加载的问题都可能导致训练过程停滞。
    4. 检查内存使用情况

      • 你的系统内存(RAM)使用情况如何?如果内存不足,可能会导致训练过程出现问题。尝试关闭其他占用大量内存的程序或增加更多的内存。
    5. 查看日志和错误消息

      • 仔细查看训练过程中输出的日志和错误消息,这可能会给出问题的线索。从图中看不到详细的错误消息,但从描述中可能有一些线索。例如,“Scanning 'data\train.cache' images and labels...”这部分是否成功完成?是否有任何错误消息或警告?
    6. 检查PyTorch版本与CUDA的兼容性

      • 你使用的PyTorch版本是2.4.1+cu124,这意味着它是为CUDA 12.4编译的。确保你的CUDA版本确实是12.4,并且与你的GPU兼容。
    7. 尝试简化问题

      • 为了确定问题是否与YOLOv5或你的特定设置有关,你可以尝试运行一些简单的PyTorch代码来测试GPU是否工作正常。例如,你可以创建一个简单的神经网络模型,并使用GPU进行训练,看看是否能够正常使用GPU。
    8. 其他软件问题

      • 有时,某些软件或后台进程可能会干扰GPU的正常工作。确保没有其他程序或进程正在使用GPU。此外,尝试重新启动计算机并再次尝试训练。
    9. 检查CUDA和驱动程序更新

      • 有时,更新CUDA和NVIDIA驱动程序版本可以解决某些问题。确保你使用的是最新或推荐的版本。

    希望这些建议能帮助你解决问题。如果问题仍然存在,建议提供更多的详细错误消息或日志,这样可能更容易诊断问题所在。

    评论

报告相同问题?

问题事件

  • 创建了问题 9月13日

悬赏问题

  • ¥15 35114 SVAC视频验签的问题
  • ¥15 impedancepy
  • ¥15 在虚拟机环境下完成以下,要求截图!
  • ¥15 求往届大挑得奖作品(ppt…)
  • ¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
  • ¥50 浦育平台scratch图形化编程
  • ¥20 求这个的原理图 只要原理图
  • ¥15 vue2项目中,如何配置环境,可以在打完包之后修改请求的服务器地址
  • ¥20 微信的店铺小程序如何修改背景图
  • ¥15 UE5.1局部变量对蓝图不可见