wuxin_variable 2022-04-12 15:51 采纳率: 100%
浏览 1290
已结题

yolo训练报错“CUDA Error: out of memory”(3060显卡6G显存)

问题遇到的现象和发生背景
按照课程做试验到训练的步骤,训练时报错“CUDA Error: out of memory”,程序停止。我使用的GPU是 RTX 3060 Laptop,显存是6G,参数已经调整为:

batch=64
subdivisions=64

问题相关代码,请勿粘贴截图

darknet.exe detector train data\tt100k.data cfg\yolov4-tt100k.cfg yolov4.conv.137 -map

运行结果及报错内容

896 x 896
Create 6 permanent cpu-threads
Try to set subdivisions=64 in your cfg-file.
CUDA status Error: file: D:\work-ai\darknet\src\dark_cuda.c : cuda_make_array() : line: 492 : build time: Feb 23 2022 - 12:15:10

CUDA Error: out of memory
Darknet error location: D:\work-ai\darknet\src\dark_cuda.c, check_error, line #69
CUDA Error: out of memory: No error

我的解答思路和尝试过的方法

把参数subdivisions修改为 16、32、64都报错,报错时用nvidia-smi查看GPU显存,发现已使用5.359G

我想要达到的结果

运行这个“中国交通标志识别”项目,大概多少G显存够用?

  • 写回答

2条回答 默认 最新

  • wuxin_variable 2022-04-12 16:25
    关注

    1 batchsize调到8 也是一样的报错。
    2 训练前我用nvidia-smi查看GPU显存,已使用0.121G(总共6G),一旦开始训练已使用显存数据就开始上升,最终到5.359G后程序报错停止运行。

    img

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月20日
  • 已采纳回答 4月12日
  • 创建了问题 4月12日

悬赏问题

  • ¥20 keepalive配置业务服务双机单活的方法。业务服务一定是要双机单活的方式
  • ¥50 关于多次提交POST数据后,无法获取到POST数据参数的问题
  • ¥15 win10,这种情况怎么办
  • ¥15 如何在配置使用Prettier的VSCode中通过Better Align插件来对齐等式?(相关搜索:格式化)
  • ¥100 在连接内网VPN时,如何同时保持互联网连接
  • ¥15 MATLAB中使用parfor,矩阵Removal的有效索引在parfor循环中受限制
  • ¥20 Win 10 LTSC 1809版本如何无损提升到20H1版本
  • ¥50 win10 LTSC 虚拟键盘不弹出
  • ¥30 微信小程序请求失败,网页能正常带锁访问
  • ¥15 Matlab求解微分方程,如何用fish2d进行预优?