深度学习时的gpu和cpu使用率

在pytorch环境下进行深度学习，在没有其他后台的情况下，cpu的占用率在50％左右，gpu只有5％左右，但cuda的使用率能达到70％。此时的速度很慢，数据集大概700张图片左右，一个epoch就需要将近4分钟。

这种情况是正常的吗？还是说是没有设置好？
另外跑了400个epoch后，loss保持在0.01左右，这个loss怎么样？
ps：笔记本的配置是R7-4800H+RTX2060(6GB)，环境为py3.9，pytorch1.8.1，cuda11.1

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2023-02-01 09:15
关注
简单来说，gpu的利用率是指平均利用率而不是瞬时。所以你这个是显卡有调用，但是由于显卡计算速度快，而数据读到显卡里面慢的问题。也就是显卡计算完毕之后是在等待cpu指令然后内存给数据，他是空闲状态才导致利用率低的。所以你这个目前瓶颈是在IO这里，看情况应该是内存不够大，导致没法一次性加载多个batch数据等待GPU计算，导致GPU计算完毕之后是空闲状态，这种情况只能加内存，笔记本双通道如果都满了的话就没法子了，也不建议一次换16*2的内存（土豪请无视）。你可以将num worker设置的再大一些看下情况。
另外，你这个模型本身应该也是挺大的吧，700张图像4分钟还算可以接受的范围啊。

最后，笔记本本来就不适合训练，只适合学习的，偶尔跑跑还行，要想训练出结果，还得是台式机或者服务器，毕竟显卡对比桌面GPU性能啥的基本上都给你砍了一半左右

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

深度学习时的gpu和cpu使用率 python pytorch 深度学习
2023-01-31 19:05

回答 4 已采纳简单来说，gpu的利用率是指平均利用率而不是瞬时。所以你这个是显卡有调用，但是由于显卡计算速度快，而数据读到显卡里面慢的问题。也就是显卡计算完毕之后是在等待cpu指令然后内存给数据，他是空闲状态才导致
argis pro 3.0 深度学习使用GPU不行 arcgis python 深度学习
2022-11-27 00:07

回答 1 已采纳显卡是什么显卡？一般是不建议使用最新版本的cuda，虽然说高版本可以兼容低版本，但是你不能保证软件是否一定可以兼容，我比较建议换软件出来之前的最新版本的cuda和cudnn另外，你连接的里面找到论坛h
深度学习代码运行时GPU内存不足 python 深度学习计算机视觉
2022-07-19 19:09

回答 1 已采纳减小BatchSize
如何监控和改进用于深度学习的 GPU 使用率？
2022-10-13 17:17

赋创小助手的博客如果您刚刚为您的下一个很棒的深度学习项目购买了一些漂亮的闪亮 GPU，并且已经开始工作。您可以听到风扇呼呼的声音（或者您可以想象它们在云中某处呼呼），但您如何确保充分利用这些 GPU？下面我们将介绍一些可用于...
pytorch 模型在GPU上但训练时仍使用CPU python 有问必答神经网络
2021-05-13 18:05

回答 3 已采纳你要安装cuda和cudnn，参考一下https://zhuanlan.zhihu.com/p/106133822
跑深度学习为什么两个软件显示的的GPU资源使用不一样啊？ python 机器学习深度学习
2021-07-24 21:59

回答 1 已采纳鄙人接触过AI换脸有两个版本一个是英伟达用CUDA技术还有个就是AMD和intel 两者不能混用据我的知识库了解深度学习是吃显存的
关于网络训练过程中cpu使用率过低的问题 python pytorch 深度学习
2022-08-13 16:38

回答 1 已采纳楼主，我没太搞明白的是你到底是gpu训练还是cpu训练？还有你的batch_size是多少？数据增加后有变化batch_size吗？还有你有观察内存和虚存吗？目前看你的内存有点差啊，虽然gpu运算中主
0921深度学习硬件CPU和GPU
2022-09-21 18:33

不玩游戏的小菜鸡的博客 GPU：使用更多的小核和更好的内存带宽，适合能大规模并行的计算任务设备有运行开销，数据传输时要争取量大次少而不是量少次多在训练过程中数据类型过小可能会导致数值的溢出（在推断过程中影响不大）
GPU和CPU之间的传输速率 c++
2020-08-31 19:25

回答 1 已采纳显存带宽是 GPU 和显存连接的数据传输率，也就是你说的显存频率 x 位宽。 CPU和GPU传输速率主要取决于北桥和CPU，以及北桥和PCIE的速率。北桥和CPU，也就是 Intel QPI总线，
YOLO v5训练使用CPU正常，使用GPU训练 box cls obj均为nan pytorch 深度学习目标检测
2022-01-15 21:21

回答 2 已采纳解决了，既然锁定问题出在显卡上，在坚信不是硬件问题的前提下，只能一遍一遍换驱动版本。刚开始用的最早的驱动版本是11.3，pytorch支持的另一个cuda版本10.2 nvidia官网不支持wind
vs2017IDE+python+深度学习框架，运行调试时怎么使用GPU加速？ tensorflow 人工智能深度学习
2019-04-18 18:22

回答 1 已采纳自己蠢了，解决问题的方法不对。。总是纠结于vs2017这个环境。。。想着配置调试环境。。。只需要在程序中编程就行了。。。
【动手学深度学习PyTorch版】23 深度学习硬件CPU 和 GPU
2022-10-30 21:06

水w的博客深度学习硬件CPU 和 GPU
在pycharm跑代码时，使用cpu可以跑但是换成gpu就不行 python 机器学习神经网络
2022-09-15 00:47

回答 7 已采纳请说明你的环境，包括torch，torchvision（这两者需要为GPU版本），cuda，cudnn，以及你的显卡型号显存大小，有些情况是安装包冲突或者安装错误，有些情况是你的显存太小，模型加载不进
《GPU并行计算与CUDA编程》课程视频和代码
2023-06-18 13:22

9. **最新技术趋势**：可能还会提及NVIDIA最新的GPU架构和技术，如Tensor Cores用于加速深度学习计算，以及CUDA-X库的更新。通过学习这门课程，开发者不仅可以掌握CUDA编程的基本技能，还能了解到GPU并行计算的...
MATLAB实现基于CPU和GPU的并行神经网络运算【深度学习、人工智能项目实战】.zip
2023-04-20 23:13

在本项目中，我们主要探讨的是如何利用MATLAB进行计算机视觉和深度学习的实战应用，特别是在CPU和GPU上的并行运算。MATLAB是一款强大的数学计算软件，它为科学研究和工程计算提供了丰富的工具箱，其中包括了专门针对...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月31日

悬赏问题

¥15 Stata链式中介效应代码修改
¥15 latex投稿显示click download
¥15 请问读取环境变量文件失败是什么原因？
¥15 在若依框架下实现人脸识别
¥15 添加组件无法加载页面,某块加载卡住
¥15 网络科学导论，网络控制
¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比，为什么Snetinel-2计算的结果最小值特别小，而Lansat8就很平均
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错

深度学习时的gpu和cpu使用率

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新