#深度学习显存# #内存# 报错torch.cuda.0ut0fMemoryError:CUDA out of memory

问题遇到的现象和发生背景

电脑1配置：RTX2080TI，显存11GB，内存64GB，cuda版本12.3，batchsize=4能运行
电脑2配置：RTX4070super，显存12GB，内存16GB，cuda版本12.4，batchsize=4报错，出现torch.cuda.0ut0fMemoryError:CUDA out of memory.Tried to allocate 128.00 MiB.GPU 0 has a total capacty of 11.99 GiB of which 5.63 GiB is free.0f the allocated memory 5.07 GiB is allocated by Py......
电脑1GPU信息

电脑2GPU信息

操作环境、软件版本等信息

都使用pycharm，python3.8，环境相同

尝试过的解决方法

缩小batchsize可以运行

我想要达到的结果

同样batchsize=4，为什么12GB显存报错，11GB可以运行呢？跟内存大小有关系吗？怎么解决啊，求帮助，感激不尽。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-05-07 20:28
关注
引自免费微信小程序：皆我百晓生

在处理深度学习模型时，显存不足的问题通常是因为模型所需的内存超过了分配给GPU的可用空间。从您提供的信息来看，两台电脑的主要区别在于显存容量（11GB vs 12GB）和CUDA版本（12.3 vs 12.4）。然而，这并不是导致问题的根本原因。实际上，问题可能出在其他方面。

首先，让我们分析一下两台电脑上的系统进程占用情况。通过nvidia-smi命令输出的信息可以看到，两个系统的GPU内存使用率都不高。这意味着大部分的显存并没有被深度学习任务占用，而是被其他应用程序占用了。在电脑2上，尽管总显存比电脑1多1GB，但可用的显存却少于电脑1。这是因为电脑2上有更多后台进程正在消耗GPU资源。

为了解决这个问题，您可以尝试以下步骤：

关闭不必要的后台进程：在开始菜单搜索栏输入"任务管理器"，查看并关闭与深度学习无关的GPU密集型应用。

调整PyTorch的内存管理策略：在您的Python脚本中加入以下代码，来优化内存管理：

import torch torch.backends.cudnn.benchmark = True torch.cuda.empty_cache()

torch.backends.cudnn.benchmark = True 可以让CuDNN选择最佳算法进行卷积运算，提高效率。 torch.cuda.empty_cache() 清空缓存，释放已分配但未使用的GPU内存。

如果仍然存在问题，考虑降低Batch Size：即使在硬件配置更高的电脑2上，Batch Size可能还是过大，导致显存溢出。将Batch Size减小可能会解决问题，比如从4降到2或更低，然后逐步增加直到找到可运行的最大值。

确保所有库（包括PyTorch、CUDA、cuDNN等）都是最新版本，并且兼容。有时旧版本的库可能会导致内存管理问题。

如果依然存在内存不足的问题，可以考虑升级硬件，例如增加更多的RAM，或者换一个具有更大显存的GPU。

使用混合精度训练（Mixed Precision Training）：对于某些模型，尤其是大型模型，使用半精度浮点数（fp16）而不是单精度浮点数（fp32）可以在不牺牲太多准确性的前提下显著减少内存需求。要启用混合精度，可以参考PyTorch官方文档中的教程：https://pytorch.org/docs/stable/notes/cuda.html#mixed-precision-training

如果您已经尝试了上述所有建议但仍遇到问题，可能需要检查您的模型结构、数据预处理以及模型训练过程是否有内存泄漏或其他可能导致内存使用过高的情况。确保模型在每个批次的训练过程中不会累积大量中间结果，可以定期清理不再需要的张量。此外，确保您在加载数据集时没有一次性加载整个数据集到内存中，而是采用迭代加载的方式来减少内存占用。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

pytorch模型提示超出内存RuntimeError: CUDA out of memory.
2021-01-20 11:53

跑模型时出现RuntimeError: CUDA out of memory.错误查阅了许多相关内容，原因是：GPU显存内存不够简单总结一下解决方法：将batch_size改小。取torch变量标量值时使用item()属性。可以在测试阶段添加如下代码：...
解决PyTorch中的`CUDA out of memory`错误
2024-07-02 08:30

默语佬的博客大家好，我是默语，擅长全栈开发、运维和人工智能技术。今天我们将深入探讨如何解决PyTorch中常见的错误。这个问题在处理大规模深度学习模型时经常出现，理解...关键词：PyTorch、CUDA、内存不足、深度学习、错误解决。
解决Pytorch 训练与测试时爆显存(out of memory)的问题
2021-01-01 15:06

Pytorch 训练时有时候会因为加载的东西过多而爆显存，有些时候这种情况还可以使用cuda的清理技术进行修整，当然如果模型实在太大，那也没办法。使用torch.cuda.empty_cache()删除一些不需要的变量代码示例如下： ...
Pytorch GPU显存充足却显示out of memory的解决方式
2020-12-23 09:56

今天在测试一个pytorch代码的时候显示显存不足，但是这个网络框架明明很简单，用CPU跑起来都没有问题，GPU却一直提示out of memory. 在网上找了很多方法都行不通，最后我想也许是pytorch版本的问题，原来我的pytorch...
【大模型报错解决】cublasLt ran into an error!
2025-05-24 14:28

小白冲鸭的博客在网上看了好多教程，有说是因为bitsandbytes...如前所述，解决办法就是——把H20-NVLink换成A40，从96GB的高显存、高成本卡换成 40G显存的低价卡，结果就完全无报错，顺利的运行成功了，或许有时候真的是大道至简吧。
云端开炉,线上训练,Bert-vits2-v2.2云端线上训练和推理实践(基于GoogleColab)
2023-12-19 12:21

刘悦的技术分享的博客假如我们一定要说深度学习入门会有一定的门槛，那么设备成本是一个无法避开的话题。深度学习模型通常需要大量的计算资源来进行训练和推理。较大规模的深度学习模型和复杂的数据集需要更高的计算能力才能进行有效的...
NVIDIA AI Enterprise 科普 | Triton 推理服务器 & TensorRT-LLM 两大组件介绍及实践
2024-06-20 17:25

赞奇科技Xsuperzone的博客 NVIDIA AI Enterprise 平台（图片源于NVIDIA） Triton 推理服务器提供了标准化的 AI 推理流程，支持部署各种深度学习和机器学习框架的AI模型，包括 TensorRT、TensorFlow、PyTorch、ONNX、OpenVINO、Python、...
六万字硬核详解：卷积神经网络CNN（原理详解 + 项目实战 + 经验分享）
2022-10-12 19:59

胖墩会武术的博客 0.0127, -0.0626, -0.1158, -0.0499, 0.1266]], grad_fn=) tensor([[ 0.1202, 0.0287, -0.0160, 0.0384, 0.0442, 0.0127, -0.0626, -0.1158, -0.0499, 0.1266]], grad_fn=) """ 1.1、面向对象编程（object-oriented ...
【LLM大模型组件】注意力机制：Qwen3-Next的架构基石 Gated DeltaNet
2025-10-31 16:52

熵增定律28的博客全局门控：控制整体记忆保留率 αt→0\alpha_t \to 0αt→0：快速清空；αt→1\alpha_t \to 1αt→1：保留全部 βt\beta_tβt 标量 ∈(0,1)\in (0,1)∈(0,1) 局部更新强度：控制新信息写入权重 βt→1\beta_t ...
【计算机视觉】Gaussian Splatting源码解读补充（二）
2024-03-20 19:13

seh_sjlj的博客 Gaussian Splatting源码解读补充的第二部分，包括相机、CUDA基础知识和前向传播等。
51c深度学习~合集2
2025-02-19 10:17

whaosoft-143的博客 深度学习复兴给大家带来了成功的喜悦，在许多任务上，以前模型做不到或做不好的事情，现在能出人意料地做得很好，需要的似乎只有数据和算力，深度学习一时间成了人工智能的代名词，学术界工业界一片欣欣向荣的景象。...
【大模型提示词工程】提示词如何帮助模型维持上下文身份一致？
2025-11-23 20:12

云博士的AI课堂的博客运行演示 python demo_simple.py --model gpt-3.5-turbo --role medical_advisor 常见问题解决 CUDA内存不足: # 启用梯度检查点和内存优化 model = AutoModel.from_pretrained( model_name, torch_dtype=torch.float...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月7日