wlty_by 2023-04-16 23:29 采纳率: 0%
浏览 22

深度学习测试时显存爆炸

请问我单卡,训练的时候显存都没有炸,测试的时候torch.load就显示THCudaCheck FAIL file=/pytorch/aten/src/THC/THCCachingHostAllocator.cpp line=278 error=2 : out of memory,最后又报错RuntimeError: CUDA error: out of memory,测试代码也加了with torch.no_grad():。

img

  • 写回答

2条回答 默认 最新

  • 夜枭龙 2023-04-17 02:48
    关注

    您好,这种情况通常是由于测试时模型参数或输入数据过大,导致显存不足,可以考虑以下几种解决方案:

    减少batch size或缩小输入图像的尺寸,以降低显存占用。

    将测试数据分批次处理,以降低显存占用。

    检查是否有未释放的显存,可以在代码中添加torch.cuda.empty_cache()命令来释放显存。

    尝试减小模型的大小,比如减小网络深度、减少卷积核数量等。

    如果您有多张显卡,可以尝试使用多卡并行来提高显存利用率。

    另外,可以使用nvidia-smi命令来监控显存使用情况,查看哪些进程占用了显存过多。

    评论

报告相同问题?

问题事件

  • 创建了问题 4月16日

悬赏问题

  • ¥15 paddle库安装时报错提示需要安装common、dual等库,安装了上面的库以后还是显示报错未安装,要怎么办呀?
  • ¥20 找能定制Python脚本的
  • ¥15 odoo17的分包重新供应路线如何设置?可从销售订单中实时直接触发采购订单或相关单据
  • ¥15 用C语言怎么判断字符串的输入是否符合设定?
  • ¥15 通信专业本科生论文选这两个哪个方向好研究呀
  • ¥50 我在一个购物网站的排队系统排队,这个排队到号后重新定向到目标网站进行购物,但是有技术牛通过技术方法直接跳过排队系统进入目标网址购物,有没有什么软件或者脚本可以用
  • ¥15 ios可以实现ymodem-1k协议 1024字节传输吗?
  • ¥300 寻抓云闪付tn组成网页付款链接
  • ¥15 请问Ubuntu要怎么安装chrome呀?
  • ¥15 视频编码 十六进制问题