为什么神经网络转移到Gpu运算后变慢

为什么神经网络转移到Gpu运算后，没有加速反而变慢了

import numpy as np
import torch
import torch.nn as nn
np.random.seed(234198)
import time
import scipy.stats
 
torch.cuda.is_available()
torch.cuda.device_count()
torch.cuda.get_device_name(0)
torch.cuda.current_device()
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)
start_time = time.time()
class stock:
    def __init__(self, T, K, sigma, delta, So, r, N, M, d):
        self.T = T 
        self.K=K 
        self.sigma=sigma *np.ones(d) 
        self.delta=delta 
        self.So=So*np.ones(d) 
        self.r=r 
        self.N=N 
        self.M=M 
        self.d=d 
    
    def GBM(self):
        
        dt=self.T/self.N
        So_vec=self.So*np.ones((1,S.M, S.d))
        
        Z=np.random.standard_normal((self.N,self.M, self.d))
        s=self.So*np.exp(np.cumsum((self.r-self.delta-0.5*self.sigma**2)*dt+self.sigma*np.sqrt(dt)*Z, axis=0))
        
        s=np.append(So_vec, s, axis=0)
        return s
    
    
    def g(self,n,m,X):
        max1=torch.max(X[int(n),m,:].float()-self.K).to(device)
       ## input_tensor = torch.tensor(self.r * (self.T / self.N) * n)
        return torch.exp((self.r * (self.T / self.N) * n) * torch.max(max1.to(device), torch.tensor([0.0]).to(device))).to(device) 
       # return np.exp((self.r * (self.T / self.N) * n)*torch.max(max1.to(device),torch.tensor([0.0]).to(device))
       

 #
class NeuralNet(torch.nn.Module):
    def __init__(self, d, q1, q2):
        super(NeuralNet, self).__init__()
        self.a1 = nn.Linear(d, q1) 
        self.relu = nn.ReLU()
        self.a2 = nn.Linear(q1, q2)
        self.a3 = nn.Linear(q2, 1)  
        self.sigmoid=nn.Sigmoid()
    
    def forward(self, x):
        out = self.a1(x)
        out = self.relu(out)
        out = self.a2(out)
        out = self.relu(out)
        out = self.a3(out)
        out = self.sigmoid(out)
        
        return out
    
def loss(y_pred,s, x, n, tau):
    r_n=torch.zeros(s.M,device=device)
    for m in range(0,s.M):
        
        r_n[m]=-s.g(n,m,x)*y_pred[m] - s.g(tau[m],m,x)*(1-y_pred[m])
    
    return(r_n.mean().to(device))
    
#%%
##def __init__(self, T, K, sigma, delta, So, r, N, M, d):
S=stock(T=3,K=100,sigma=0.4,delta=0.1,So=90,r=0.05,N=9,M=50000,d=4)

X=torch.from_numpy(S.GBM()).float().to(device) 
#%%

def NN(n,x,s, tau_n_plus_1):
    epochs=50
    model=NeuralNet(s.d,s.d+40,s.d+40).to(device)
    optimizer = torch.optim.Adam(model.parameters(), lr = 0.0001)

    for epoch in range(epochs):
        F = model.forward(X[n].to(device))
        optimizer.zero_grad()
        criterion = loss(F,S,X,n,tau_n_plus_1).to(device)
        criterion.backward()
        optimizer.step()
    
    return F,model

mods=[None]*S.N
tau_mat=torch.zeros((S.N+1,S.M)) 
tau_mat[S.N,:]=S.N

f_mat=torch.zeros((S.N+1,S.M))
f_mat[S.N,:]=1

#%%
for n in range(S.N-1,-1,-1):
    probs, mod_temp = NN(n, X, S, torch.from_numpy(np.array(tau_mat[n+1])).float().to(device))
    #probs, mod_temp=NN(n, X, S,torch.from_numpy(tau_mat[n+1]).float().to(device)) 
    mods[n]=mod_temp
    np_probs=probs.detach().reshape(S.M)
    print(n, ":", min(np_probs)," , ", max(np_probs))

    f_mat[n,:]=(np_probs > 0.5)*1.0

    tau_mat[n,:]=torch.argmax(f_mat, axis=0)

#%% 
Y=torch.from_numpy(S.GBM()).float().to(device) 

tau_mat_test=torch.zeros((S.N+1,S.M)) 
tau_mat_test[S.N,:]=S.N

f_mat_test=torch.zeros((S.N+1,S.M)) 
f_mat_test[S.N,:]=1

V_mat_test=torch.zeros((S.N+1,S.M)) 
V_est_test=torch.zeros(S.N+1)

for m in range(0,S.M):
    V_mat_test[S.N,m]=S.g(S.N,m,Y)
    
V_est_test[S.N]=torch.mean(V_mat_test[S.N,:])



for n in range(S.N-1,-1,-1):
    mod_curr=mods[n]
    probs=mod_curr(Y[n])
    np_probs=probs.detach().reshape(S.M)

    f_mat_test[n,:]=(np_probs > 0.5)*1.0

    tau_mat_test[n,:]=torch.argmax(f_mat_test, axis=0)
    
    
    for m in range(0,S.M):
        V_mat_test[n,m]=torch.exp((n-tau_mat_test[n,m])*(-S.r*S.T/S.N))*S.g(tau_mat_test[n,m],m,X) 
        
end_time = time.time()
#%%
V_est_test=torch.mean(V_mat_test, axis=1)
V_std_test=torch.std(V_mat_test, axis=1)
V_se_test=V_std_test/(np.sqrt(S.M))

z=scipy.stats.norm.ppf(0.975)
lower=V_est_test[0] - z*V_se_test[0]
upper=V_est_test[0] + z*V_se_test[0]
# 计算训练时间
training_time = end_time - start_time
print("模型训练时间：", training_time, "秒")
print(V_est_test[0])
print(V_se_test[0])
print(lower)
print(upper)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Kwan的解忧杂货铺 2024-05-26 23:23
关注
晚上好🌙🌙🌙
本答案参考ChatGPT-3.5

神经网络转移到GPU运算后，性能可能会有所下降的原因有很多，以下是一些可能的原因和对应的解决方案：

原因一：GPU计算资源有限如果训练数据集非常大或者计算量很大，那么CPU的运行速度可能会赶不上GPU的运算能力。此时，可以考虑使用分布式计算框架（如Spark、Hadoop等）来分批处理数据。

解决方案：将数据分割成多个部分，并分配到不同的GPU上进行处理；同时，可以使用GPU的并行计算能力，如OpenMP或CUDA编程。

原因二：GPU内存不足如果GPU的内存不足以存放所有的数据，那么计算的速度也会受到影响。此时，可以考虑使用更小规模的数据进行训练，或者在硬件上优化硬件配置以提高内存利用率。

解决方案：使用较小规模的数据进行训练；或者在硬件上优化硬件配置，如增加内存条、使用SSD硬盘代替HDD硬盘等。

原因三：训练时间过长如果训练的时间过长，那么CPU的运算速度也无法跟上GPU的运算速度。此时，可以通过减少数据的批次大小、优化模型结构、增加学习率等方式来缩短训练时间。

解决方案：减少数据的批次大小；优化模型结构；增加学习率等。

问题四：GPU版本不兼容不同版本的GPU可能无法完美地配合特定的深度学习框架（如TensorFlow、PyTorch等）。此时，需要确保GPU版本与深度学习框架相匹配。

解决方案：升级到最新版本的深度学习框架；选择支持GPU的深度学习框架。

问题五：训练参数设置不合理在训练神经网络时，某些参数设置不当也可能导致性能下降。例如，学习率、权重初始化方式、正则化参数等都可能影响到训练效果。

解决方案：根据实际需求调整这些参数的值。

以上就是一些可能导致神经网络转移到GPU运算后性能下降的因素及其解决方案。希望对你有所帮助。

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用mnist数据搭建的神经网络训练时GPU占用率剧烈波动人工智能机器学习神经网络
2023-04-08 12:36

回答 1 已采纳 mnist数据集太小了，所以gpu用不满，这是很正常的
jupyter 中tf 搭建神经网络 如何确定自己的GPU参与了计算？ python 分类神经网络
2022-03-02 23:40

回答 1 已采纳有个简单的办法，提前打开任务管理器翻到GPU那一栏，在训练或者预测数据的时候观察各项指标特别是复制有没有起伏
求解，为什么电脑有两个GPU 问答团队
2021-12-01 10:30

回答 1 已采纳显卡（GPU），你这个是两个显卡，第一个应该是集成显卡，第二个是独立显卡。你的电脑是什么牌子的。大部分牌子的电脑都有性能监控的，如果你在玩游戏或需要显示方面的就会启动独立显卡。平时就使用集成显卡。如果
利用gpu加速神经网络算法,为什么用gpu 模型训练
2022-08-25 13:18

快乐的小荣荣的博客特别是对于深度学习而言，过多的参数会消耗很多的时间，在神经网络训练过程中，运算最多的是关于矩阵的运算，这个时候就正好用到了GPU，GPU本来是用来处理图形的，但是因为其处理矩阵计算的高效性就运用到了深度学习...
多GPU数据并行训练的加速原理到底是什么？ tensorflow 深度学习神经网络
2021-02-18 11:11

回答 2 已采纳没错，本质是learning rate，且每个batch其实后面都要求平均梯度再反向传播，多gpu时每个batch的data多了，这时，每个batch的learning rate不变则每个da
pytorch不调用gpu运算 pytorch 深度学习
2022-11-11 16:14

回答 2 已采纳给你找了一篇非常好的博客，你可以看看是否有帮助，链接：pytorch无法调用gpu的一些解决方法
tensorflow-gpu运行神经网络时一训练内核就失联 python tensorflow
2023-03-10 22:45

回答 4 已采纳参考GPT和自己的思路：出现内核崩溃的原因可能有很多，以下是一些可能的解决方案： 1 确保你的TensorFlow-GPU版本与CUDA和cuDNN版本兼容。可以参考TensorFlow官方网站提供
利用gpu加速神经网络算法,外接gpu 训练神经网络
2022-08-31 10:43

快乐的小荣荣的博客为了达到这个目标，神经网络的模型就显得太慢，还是要用传统的局部特征匹配（localpatternmatching）加线性回归（logisticregression）的方法，这办法虽然不新但非常好使，几乎所有的广告推荐，竞价排名，新闻排序，...
跑yolo的时候gpu占用了为0 python 人工智能深度学习
2022-10-25 09:11

回答 2 已采纳显存沾满说明有调用，只不过瓶颈不在GPU，而是你的其他部分，也就是常说的木桶效应，比如你这个明显就是内存不足导致的。另外，很多人有个误解，说GPU使用率不高，是不是没调用，但是实际上这里显示的一般是平
tensorflow-gpu为何无法调用GPU进行运算？ tensorflow
2018-11-08 07:30

回答 5 已采纳在 https://ask.csdn.net/questions/710166 回答你了，如果满意，请点我回答左上角的箭头和采纳。谢谢
yolov5为什么默认要训练300次这么多人工智能深度学习神经网络
2021-04-05 20:56

回答 2 已采纳 mmdetection没试过，但是yolov5默认300多次是因为人家是在coco数据集上面训练的，而你看yolov5的主页，里面的各个模型的对比可以看出来，基本上都是300epoch的时候达到较好的
矩阵及其运算在卷积神经网络（CNN）中的应用与启发
2023-10-07 00:12

云边牧风的博客卷积神经网络（CNN）简介2.1 CNN基本原理2.2 CNN的优势和应用领域3. 矩阵在CNN中的应用3.1 图像表示与卷积运算3.2 特征提取与矩阵分解3.3 参数优化与梯度计算3.4 图像生成与矩阵合成4. 矩阵运算在CNN设计与优化中的...
tensorflow-gpu为何无法调用GPU进行运算??? tensorflow
2018-11-08 07:52

回答 3 已采纳 GT730有好几种，一个是GT640的马甲卡，采用Kepler核心，384 CUDA Cores，叫做GK208/GK107，反正有个K，这个支持CUDA 3.0，可以跑TF（但是相当慢）还有一个
人工智能之卷积神经网络(CNN)
2024-01-19 08:30

AI小白龙*的博客 CNN已经成为众多科学领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以直接输入原始图像，因而得到了更为广泛的应用。
为什么 GPU 适用于 AI 卷积计算 cnn GPU 线程分级计算强度 FP32 和 FP64
2024-04-26 18:03

EwenWanW的博客为什么 GPU 适用于 AI 计算或者为什么 AI 训练需要使用 GPU，而不是使用 CPU 呢？本节内容主要探究 GPU AI 编程的本质，首先回顾卷积计算是如何实现的，然后探究 GPU 的线程分级，分析 AI 的计算模式和线程之间的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月26日

悬赏问题

¥15 web课程，怎么做啊😭没好好听课根本不知道怎么下手
¥15 做一个关于单片机的比较难的代码，然后搞一个PPT进行解释
¥15 python提取.csv文件中的链接会经常出现爬取失败
¥15 数据结构中的数组地址问题
¥15 maya的mel里，怎样先选择模型A，然后利用mel脚本自动选择有相同名字的模型B呢。
¥15 Python题，根本不会啊
¥15 会会信号与系统和python的来
¥15 关于#python#的问题
¥20 oracle RAC 怎么配置啊，配置
¥15 excel 日常使用中出现问题

为什么神经网络转移到Gpu运算后变慢

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新