问题：PyTorch中如何实时查看GPU显存使用情况？

在使用PyTorch进行深度学习训练或推理时，如何实时查看GPU显存使用情况是一个常见且关键的问题。许多开发者在调试模型、优化内存占用或排查显存溢出（Out of Memory）错误时，迫切需要了解当前GPU显存的分配和使用状况。PyTorch提供了多种内置方法和工具，如`torch.cuda.memory_allocated()`、`torch.cuda.memory_reserved()`等函数，可用于程序中实时监控显存使用。此外，结合第三方工具如NVIDIA的`nvidia-smi`命令行工具或PyTorch Profiler，也能实现更直观和全面的监控。掌握这些方法对于提升模型训练效率和资源管理至关重要。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
羽漾月辰 2025-08-14 05:40
关注
一、PyTorch中GPU显存监控的初步认识

在深度学习训练或推理过程中，GPU显存的使用情况直接影响模型的运行效率与稳定性。PyTorch作为主流深度学习框架之一，提供了丰富的API用于监控显存使用。

常见的显存监控函数包括：

torch.cuda.memory_allocated()：返回当前分配的显存大小（单位为字节）。
torch.cuda.memory_reserved()：返回当前保留的显存大小（包括已分配和未分配部分）。
torch.cuda.max_memory_allocated()：返回程序运行过程中分配过的最大显存。
torch.cuda.empty_cache()：释放未被占用的缓存，有助于调试显存问题。

二、显存监控的进阶用法

为了更深入地理解显存使用情况，开发者可以将这些函数嵌入到训练或推理的每一步中，进行实时监控。例如，在训练循环中打印显存信息：

for epoch in range(epochs): for inputs, labels in dataloader: inputs, labels = inputs.cuda(), labels.cuda() outputs = model(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step() optimizer.zero_grad() print(f"Allocated: {torch.cuda.memory_allocated() / 1024 ** 2:.2f} MB") print(f"Reserved: {torch.cuda.memory_reserved() / 1024 ** 2:.2f} MB")

通过这种方式，开发者可以发现显存使用的峰值，并据此优化模型结构或批量大小。

三、结合第三方工具进行系统级监控

除了在代码中进行显存监控外，还可以使用系统级工具进行更全面的观察。

NVIDIA的nvidia-smi命令行工具可以实时查看GPU的显存使用、温度、功耗等信息：

$ nvidia-smi -q -d MEMORY

输出示例（简化）：

GPU ID Used Memory Total Memory
0 3072 MB 16384 MB
1 2048 MB 16384 MB

四、使用PyTorch Profiler进行细粒度分析

PyTorch Profiler是PyTorch提供的性能分析工具，可以记录每一步操作的显存使用情况，帮助开发者识别内存瓶颈。

with torch.profiler.profile(profile_memory=True, record_shapes=True) as prof: output = model(input) print(prof.key_averages().table(sort_by="cuda_memory_usage", row_limit=10))

输出示例（简化）：

Operator CUDA Memory Usage (MB)
aten::linear 150.2
aten::addmm 98.5
aten::relu 20.1

五、显存监控的可视化与自动化

对于需要长期运行或自动监控的场景，可以将显存数据写入日志文件或使用可视化工具进行展示。

例如，使用TensorBoard记录显存使用情况：

from torch.utils.tensorboard import SummaryWriter writer = SummaryWriter() for step in range(100): writer.add_scalar('GPU Memory Allocated', torch.cuda.memory_allocated() / 1024**2, step) writer.add_scalar('GPU Memory Reserved', torch.cuda.memory_reserved() / 1024**2, step) # 模拟训练过程 time.sleep(0.1)

通过TensorBoard，开发者可以直观地观察显存使用趋势，辅助优化模型训练过程。

六、显存溢出（OOM）的排查与优化策略

当出现显存溢出错误时，以下策略可以帮助排查与优化：

减少批量大小（batch size）。
使用混合精度训练（AMP）。
启用torch.utils.checkpoint以空间换时间。
使用torch.cuda.empty_cache()释放未使用的缓存。
检查模型中是否存在冗余计算或内存泄漏。

此外，结合PyTorch Profiler和nvidia-smi可以更准确地定位问题源头。

七、监控流程图示例

下图展示了在PyTorch训练流程中嵌入显存监控的逻辑流程：

graph TD A[开始训练] --> B[加载数据] B --> C[前向传播] C --> D[反向传播] D --> E[更新参数] E --> F[调用显存监控函数] F --> G{是否完成训练?} G -- 否 --> A G -- 是 --> H[结束训练]
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

GPU ID	Used Memory	Total Memory
0	3072 MB	16384 MB
1	2048 MB	16384 MB

Operator	CUDA Memory Usage (MB)
aten::linear	150.2
aten::addmm	98.5
aten::relu	20.1

报告相同问题？

关注问题

PyTorch中的多GPU加速：提高神经网络训练效率的关键策略
2023-07-14 01:44

程序员光剑的博客深度学习的发展和应用极大的促进了计算机视觉、自然语言处理等领域的快速发展。近年来，随着计算能力的不断提升和互联网的飞速发展，许多公司都希望利用深度学习技术解决各种复杂的问题。比如，在工业界，自动驾驶、...
新版PyTorch：AI任务加速与Intel GPU集成
2024-07-29 07:15

庞德公的博客 Pytorch 2.4 推出AI任务加速，提供对Intel GPU的支持。PyTorch 2.4现在为Intel数据中心GPU Max系列提供支持，该系列将Intel GPU和 SYCL 软件堆栈集成到标准PyTorch 堆栈中
PyTorch中常用的工具（5）使用GPU加速：CUDA
2024-01-01 00:03

Tian Fengshou的博客本章主要介绍PyTorch在这些方面常用的工具模块，合理使用这些工具可以极大地提高编程效率。由于内容较多，本文分成了五篇文章（1）数据处理（2）预训练模型（3）TensorBoard（4）Visdom（5）CUDA与小结。1 数据处理2...
无需手动安装驱动：PyTorch-CUDA镜像自带GPU兼容支持
2025-11-24 18:48

北海有座岛的博客本文介绍如何使用PyTorch-CUDA Docker镜像实现开箱即用的GPU加速深度学习环境，解决CUDA、cuDNN与PyTorch版本兼容难题，提升开发效率并保障多平台一致性。
PyTorch-CUDA镜像内建监控工具，实时查看GPU利用率
2025-11-24 19:26

Ga Ou的博客本文介绍如何利用PyTorch-CUDA镜像内置的NVML和pynvml工具实时监控GPU利用率、显存占用与温度，实现训练过程的可观测性。通过命令行、Python脚本及训练流程集成三种方式，帮助开发者快速发现I/O瓶颈、显存溢出等问题...
GPU显存优化实战：Beyond PyTorch的定制化内存分配器开发
2025-04-14 13:52

九章云极AladdinEdu的博客本文突破框架默认内存管理机制，从CUDA底层原理出发，解析如何开发定制化内存分配器，并通过Zero-Copy与Unified Memory的混合策略实现显存利用率提升3倍，为高校实验室的显存优化提供系统级解决方案。
使用 C# 入门深度学习：Pytorch 基础
2024-11-13 07:10

dotNET跨平台的博客教程名称：使用 C# 入门深度学习作者：痴者工良地址：https://torch.whuanle.cn1.2 Pytorch 基础本文内容介绍 Pytorcn 的基础 API，主要是数组的创建方式和运算方式，由于相关内容跟 Numpy 比较相似，并且 Numpy ...
轻松实现GPU加速推理：PyTorch-CUDA镜像应用指南
2025-11-24 18:46

云山雾村的博客本文介绍如何利用PyTorch-CUDA容器镜像快速实现GPU加速的深度学习训练与推理，避免环境配置难题。通过Docker一键部署，支持多卡训练和生产级服务，提升AI工程化效率。
AI开发者必看：PyTorch-CUDA基础镜像使用实战
2025-11-24 18:39

潮水岩的博客本文深入解析PyTorch-CUDA基础镜像的使用，涵盖环境一致性、多卡训练优化与新人快速上手三大场景，结合Docker容器化技术实现AI开发环境标准化，提升训练效率与协作能力。
pytorch安装教程gpu
2024-08-25 21:02

Python老吕的博客 PyTorch 是一个开源的机器学习库，广泛用于计算机视觉和自然语言处理等应用。它由 Facebook 的人工智能研究团队开发，并得到了许多研究机构和企业的支持。PyTorch 以其易用性、灵活性和高效性而受到开发者的青睐。在...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月14日

问题：PyTorch中如何实时查看GPU显存使用情况？

1条回答 默认 最新

一、PyTorch中GPU显存监控的初步认识

二、显存监控的进阶用法

三、结合第三方工具进行系统级监控

四、使用PyTorch Profiler进行细粒度分析

五、显存监控的可视化与自动化

六、显存溢出（OOM）的排查与优化策略

七、监控流程图示例

问题事件

1条回答默认最新