请教一个深度学习中如何使用GPU加速的问题

#我使用GPU加速时出现了问题，我的cpu被占满了，我的GPU的使用率一上一下的

#以下是我的代码：

import numpy as np
import matplotlib.pyplot as plt
import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"

# print(torch.cuda.is_available())     # True
# # 查看GPU数量，索引号从0开始
# print(torch.cuda.current_device())   # 0
# # 根据索引号查看GPU名字
# print(torch.cuda.get_device_name(0)) # NVIDIA GeForce GTX 1050 Ti

# 定义训练设备
device = torch.device("cuda")     #使用gpu

#prepare dataset
class DiabetsDataset(Dataset):
    def __init__(self,filepath):
        xy = np.loadtxt(filepath,delimiter=',',dtype=np.float32)
        self.len = xy.shape[0] #shape会返回xy的长度，如果xy是二维shape[0]就是行数，shape[1]就是列数
        self.x_data = torch.from_numpy(xy[:,:-1])
        self.y_data = torch.from_numpy(xy[:, [-1]])

    def __getitem__(self, index):
        return self.x_data[index],self.y_data[index]

    def __len__(self):
        return self.len

dataset = DiabetsDataset('diabetes.csv')
train_loader = DataLoader(dataset=dataset,batch_size=32,shuffle=True,num_workers=8)

#bulid model
class Model(torch.nn.Module):
    def __init__(self):
        super(Model,self).__init__()
        self.linear1 = torch.nn.Linear(8, 6)
        self.linear2 = torch.nn.Linear(6, 4)
        self.linear3 = torch.nn.Linear(4, 1)
        self.sigmoid = torch.nn.Sigmoid()

    def forward(self,x):
        x = self.sigmoid(self.linear1(x))
        x = self.sigmoid(self.linear2(x))
        x = self.sigmoid(self.linear3(x))
        return x

model = Model()
model.to(device)   #将模型用到gpu

#LOSS and OPTIMIZER
criterion = torch.nn.BCELoss(reduction='mean')
criterion.to(device)      #将损失函数放到GPU
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

#train cycle
# training cycle forward, backward, update
if __name__ == '__main__':
    for epoch in range(100):
        for i, data in enumerate(train_loader, 0): # train_loader 是先shuffle后mini_batch
            inputs, labels = data
            inputs = inputs.to(device)  #将数据放到GPU
            labels = labels.to(device)#将数据放到GPU
            y_pred = model(inputs)
            loss = criterion(y_pred, labels)
            print(epoch, i, loss.item())

            optimizer.zero_grad()
            loss.backward()

            optimizer.step()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
使者大牙深度学习领域新星创作者 2023-12-19 15:19
关注
这里问了两个问题：

为什么数据在GPU计算，反而CPU被占满了？
为什么GPU的使用率一上一下的？

首先回答第一个问题：我们看到CPU被占满的同时，也应该注意到内存也几乎满了，这里最可能的原因是你读取的.csv文件太大了，

train_loader = DataLoader(dataset=dataset,batch_size=32,shuffle=True,num_workers=8)

而且你还指定加载数据的子进程数量num_workers=8，虽然增加num_workers可以提升数据加载的速度，但是过多的子进程可能会导致系统资源竞争（如CPU、内存或I/O资源），反而降低性能（就好像让一堆人拥挤着同时过一个小门，还不如有序排队一个一个过的效率高）。因此，选择合适的num_workers值通常需要根据具体的硬件环境和数据集大小进行调整。

也就是说，CPU占用率过高根本不是因为模型在计算数据，而是在进行数据加载。 解决的方法是降低num_workers的值，试试4或者2甚至0

第二个问题原因非常简单，因为对GPU来说这个计算任务太简单了（这个模型只有3个全连接层+激活函数），GPU很快就算完了，所以大部分时间在闲置，就看到了GPU的占用率是这种“梳子”形曲线。

我在这篇文章中对比过GPU和CPU在大矩阵上的计算速度【PyTorch&TensorBoard实战】GPU与CPU的计算速度对比（附代码） GPU在并行计算上真的拥有巨大优势！
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

深度学习时的gpu和cpu使用率 python pytorch 深度学习
2023-01-31 19:05

回答 4 已采纳简单来说，gpu的利用率是指平均利用率而不是瞬时。所以你这个是显卡有调用，但是由于显卡计算速度快，而数据读到显卡里面慢的问题。也就是显卡计算完毕之后是在等待cpu指令然后内存给数据，他是空闲状态才导致
argis pro 3.0 深度学习使用GPU不行 arcgis python 深度学习
2022-11-27 00:07

回答 1 已采纳显卡是什么显卡？一般是不建议使用最新版本的cuda，虽然说高版本可以兼容低版本，但是你不能保证软件是否一定可以兼容，我比较建议换软件出来之前的最新版本的cuda和cudnn另外，你连接的里面找到论坛h
跑深度学习为什么两个软件显示的的GPU资源使用不一样啊？ python 机器学习深度学习
2021-07-24 21:59

回答 1 已采纳鄙人接触过AI换脸有两个版本一个是英伟达用CUDA技术还有个就是AMD和intel 两者不能混用据我的知识库了解 深度学习是吃显存的
【深度学习】单机多卡 | DataParallel将计算任务在多个 GPU 上并行执行，可以在多个 GPU 上分摊工作负载，从而加快训练速度
2024-06-28 22:56

是Yu欸的博客 PyTorch 中的一个工具，可以让模型在多个 GPU 上并行运行。它通过将输入批次拆分成多个子批次，每个子批次发送到不同的 GPU 上，并行执行前向传播和反向传播，然后将每个 GPU 上的梯度聚合到主 GPU 上进行参数更新。
vs2017IDE+python+深度学习框架，运行调试时怎么使用GPU加速？ tensorflow 人工智能深度学习
2019-04-18 18:22

回答 1 已采纳自己蠢了，解决问题的方法不对。。总是纠结于vs2017这个环境。。。想着配置调试环境。。。只需要在程序中编程就行了。。。
macOS 可以使用Numba实现GPU加速运算吗？ python 机器学习深度学习
2022-05-27 10:58

回答 1 已采纳明确的说, 是不行的, 它的GPU加速本质上底层用的CUDA, 而CUDA必须基于NVIDIA 显卡/GPU, 目前你的Mac上应该没有NVIDIA显卡
深度学习代码运行时GPU内存不足 python 深度学习计算机视觉
2022-07-19 19:09

回答 1 已采纳减小BatchSize
百度 AI Studio——《高层API助你快速上手深度学习》课程学习总结
2021-03-02 18:29

baby_hua的博客一开始报名参与这个课程还是信心满满，然而最终没有顺利结课，也是备受打击，课程学习博客更新到第二节，也不会有后续的几节直播课的笔记，这篇就是对前一段深度学习的总结；今天这篇文章，完全手码的，无他，仅为...
python使用多gpu问题 python pytorch 深度学习
2022-07-20 11:57

回答 3 已采纳 DDP神坑，基本无解换launch看看？ python -m torch.distributed.launch或者看下这个 distributed training no
训练模型的时候显示GPU可使用内存不够，打开任务管理器查看内存是够用是什么情况？ python 人工智能深度学习
2021-07-22 09:48

回答 4 已采纳我的猜测，你可能有一块集成显卡，但没有禁用
YOLO V5怎么多GPU同时训练一个项目？深度学习神经网络
2021-05-11 10:28

回答 1 已采纳 parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu') defau
深度学习之全面了解 GPU
2023-12-24 23:36

叁苏言的博客假设您已经成功地训练了网络，使用 CPU 就能很好地进行推断。与 GPU 相比，速度差异更为可控，而且我们还改进了这些网络基于 CPU 的推断性能。
深度学习、Python、代码在服务器运行时遇到问题 python 有问必答服务器深度学习
2022-01-22 22:12

回答 2 已采纳 loss_unsup = torch.mean(((tensor_vec-mean_pred)*2)/sigma_est[0]) + 1.0self.lambda_vartorch.log(torch
脑电EEG代码开源分享【6. 分类模型-深度学习篇】
2022-09-29 17:53

Coco恺撒的博客分类模型-深度学习篇主要介绍了基础的网络结构框架，将深度学习解决脑电领域问题，形成【BCI + AI】的处理框架，为脑机接口的科研开辟了新赛道、新领域。本文介绍了3种经典模型架构，分别是：图像领域的卷积神经...
我的三年自学深度学习之路
2021-05-31 15:20

羽峰码字的博客 3月末确定之后，我就出去实习了一个月，那时候使用的还是还是c，考研考的c，所以对其还是比较了解，实习了一个月，也是这一个月的实习，接触到了深度学习这个热门领域，18年那时，深度学习已经很火了，动不动会调个...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月18日

悬赏问题

¥20 思科：Router c3600 MN-4E插槽
¥15 16进制修改视频的元数据
¥15 岛津txt格式文件转nirs格式
¥15 石墨烯磁表面等离子体
¥15 angular 项目无法启动
¥15 安装wampserver，图标绿色，但是无法进入软件
¥15 C++ MFC 标准库加密解密解惑
¥15 两条数据合并成一条数据
¥15 Ubuntu虚拟机设置
¥15 comsol三维模型中磁场为什么没有“速度（洛伦兹项）”这一选项

请教一个深度学习中如何使用GPU加速的问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新