itoshi rin 2023-03-17 01:21 采纳率: 0%
浏览 283
已结题

自己数据集跑yolov5报错RuntimeError: Unable to find a valid cuDNN algorithm to run convolution

我用的是mistgpu3080的12G跑的yolov5,用的数据集有四千多张,训练集三千九百多张,但是开始训练总是在第一个epoch结束之后报错“RuntimeError: Unable to find a valid cuDNN algorithm to run convolution”,我搜索了一下,大部分都是因为显存不够报错,改下batchsize就好了,但是我的显存占用只有百分之十,gpu利用率只有7%,我将batchsize从16改到2,甚至最后改到1😤,把numworker改到0还是在第一轮之后报这个错误,我这个是因为什么呢,求大佬解答一下

img

img

  • 写回答

1条回答 默认 最新

  • 追cium 2023-03-17 02:40
    关注

    参考GPT和自己的思路:

    您好!看您的描述,您已经尝试通过调整batchsize和num_workers来解决这个问题,但仍然无法解决。根据报错信息“Unable to find a valid cuDNN algorithm to run convolution”,这个错误通常与cuDNN库有关,可能是版本不兼容或安装有问题。您可以逐步排除以下一些可能原因:

    1. 确保您的cuDNN库的版本与您的GPU驱动程序和CUDA版本兼容,并已正确安装和配置。您可以尝试重新安装正确的cuDNN,也可以使用CUDA自带的cuDNN库。

    2. 检查您的代码中关于cuDNN的配置是否正确,例如使用了正确的算法、参数等。

    3. 检查您的代码是否存在其他问题,如内存泄漏等,可能会引起意外的cuDNN错误。

    4. 如果您使用的是第三方库或框架,请查看其文档或其他用户的反馈,看看是否有类似的问题或解决方法。

    希望这些建议能对您有所帮助!

    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 4月12日
  • 创建了问题 3月17日

悬赏问题

  • ¥15 有关类的报错,在模块里调用另一个模块的方法下的变量时出错
  • ¥15 delphi7 HMAC_SHA256方式加密
  • ¥15 关于#qt#的问题:我想实现qcustomplot完成坐标轴
  • ¥15 下列c语言代码为何输出了多余的空格
  • ¥15 kali linux用wget archive.kali.org/archive-key.asc指令下载签名无效(失败)
  • ¥15 openHarmony 利用c++程序在dayu210开发板上实现拉取RTSP视频流并且在屏幕上显示
  • ¥15 GD32H757的can通信配置
  • ¥20 nist随机数测试的问题
  • ¥20 帮我解决这个项目,thank you各位程序员
  • ¥15 哪位能用ea软件做一下,有偿