初学者在深度学习中遇到的有关gpu计算的困惑

在动手学习深度学习中我碰到有关GPU计算的疑惑，首先给出代码

def corr2d(X, K):  
    """计算二维互相关运算"""
    h, w = K.shape
    Y = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i, j] = (X[i:i + h, j:j + w] * K).sum()
    return Y

def corr2d_multi_in(X, K):
    # 先遍历“X”和“K”的第0个维度（通道维度），再把它们加在一起
    return sum(corr2d(x, k) for x, k in zip(X, K))

def corr2d_multi_in_out(X, K):
    # 迭代“K”的第0个维度，每次都对输入“X”执行互相关运算。
    # 最后将所有结果都叠加在一起
    return torch.stack([corr2d_multi_in(X, k) for k in K], 0)

这三个函数共同实现了多输入多输出通道的互相关运算。

def corr2d_multi_in_out_1x1(X, K):
    c_i, h, w = X.shape
    c_o = K.shape[0]
    X = X.reshape((c_i, h * w))
    K = K.reshape((c_o, c_i))
    # 全连接层中的矩阵乘法
    Y = torch.matmul(K, X)
    return Y.reshape((c_o, h, w))

上面的函数是使用全连接层实现1×1卷积核的多输入多输出通道的互相关运算，c_i为输入通道数，c_o为输出通道数。

接下来我们尝试使用GPU比较两种1×1卷积核互相关运算的速度差异。

def try_gpu(i=0):  
    """如果存在，则返回gpu(i)，否则返回cpu()"""
    if torch.cuda.device_count() >= i + 1:
        return torch.device(f'cuda:{i}')
    return torch.device('cpu')




import time
import torch
X = torch.normal(0, 1, (3, 1920, 1080),device=try_gpu())
K = torch.normal(0, 1, (2, 3, 1, 1),device=try_gpu())
startTime1=time.time()
for i in range(100):
    
    Y1=corr2d_multi_in_out_1x1(X, K)
    
endTime1=time.time()
print(round((endTime1 - startTime1)*1000, 2),'ms')

164.34 ms

运行时间为164.34ms。

startTime2=time.time()
for i in range(100):
    
    Y2=corr2d_multi_in_out(X, K)
    
endTime2=time.time()
print(round((endTime1 - startTime1)*1000, 2),'ms')

我继续尝试使用另一种方法计算，但运行半天都没有结果，于是我试着减小计算量。

startTime2=time.time()
Y2 = corr2d_multi_in_out(X, K)
endTime2=time.time()
print(round((endTime2 - startTime2)*1000, 2),'ms')

这个计算量够小了吧，但也是迟迟没有结果,于是我再次减小。

X = torch.normal(0, 1, (3, 192, 108),device=try_gpu())
startTime3=time.time()
Y3 = corr2d_multi_in_out(X, K)
endTime3=time.time()
print(round((endTime3 - startTime3)*1000, 2),'ms')

7757.1 ms

运行结果为7757.1ms！我不敢相信，便改为cpu计算

X = torch.normal(0, 1, (3, 192, 108))
K = torch.normal(0, 1, (2, 3, 1, 1))
startTime4=time.time()
Y4 = corr2d_multi_in_out(X, K)
endTime4=time.time()
print(round((endTime4 - startTime4)*1000, 2),'ms')

1930.15 ms

结果是1930.15ms，比GPU还快！这到底是什么原因，难道是GPU不擅长运行传统for循环吗？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
De-Chang Wang 2024-09-10 12:51
关注
有可能是内存访问问题，我的一篇博客中写到过这类问题

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

初学者，C语言学习中又遇到难题了 c++ c语言
2022-10-14 10:12

回答 4 已采纳 scanf就是输入函数，你得把数输进去了才能进行运算，如果还是输不进去，就看看是不是键盘的问题了
php初学者学习中遇到的小问题，特别想钻牛角尖搞明白 php
2022-04-16 00:03

回答 2 已采纳原生查询里的数据表名字的单引号去了试试
初学者学习c语言遇到问题 c语言
2022-10-19 19:08

回答 4 已采纳 if() { }else{ } else后面没有括号，有用记得采纳呐
一文读懂！人工智能、机器学习、深度学习的区别与联系！_人工智能、机器学习和深度学习
2024-07-27 17:30

功城师的博客通过利用各种技术（如机器学习、深度学习、专家系统等），人工智能系统可以处理和分析大量数据，自主地学习和优化算法，从而完成各种复杂的任务。人工智能的应用非常广泛，包括但不限于语音识别、图像识别、自然语言...
Python初学者，在文件部分遇到的基础问题 python
2022-09-04 14:42

回答 1 已采纳 #将用户输入存到变量中 name = input('what is your name:') #打开一个文件，将变量写入文件 with open('name.txt', mode='w', enco
初学者在运用switch时遇到问题，求帮助 c语言
2022-10-27 15:31

回答 2 已采纳 int score;printf("输入成绩：\n");scanf("%d",&score);int a=score/10;
深度学习初学者，keras相关的问题，以下代码看不懂，能不能给解释下？ python tensorflow 深度学习神经网络
2019-04-29 16:23

回答 3 已采纳 Dense 是全连接层 Conv2D 是二维卷积层（这是卷积网络的核心） MaxPooling2D 这是池化（根据区块只保留最大的值） Dropout BatchNormalization 是
计算机视觉深度学习入门笔记-从理论到实战案例
2023-08-25 08:40

HopES0的博客就如同追求物理学中大统一，对于各式的AI模型，人们希望建立一个统一的通用人工智能（AGI）。在自然语言模型中，ChatGPT或许已经具有在部分领域AGI的雏形，尽管其仍然存在很多问题，对于某些交互存在胡言乱语的情况...
minst深度学习例程不收敛，成功率始终在十几 tensorflow 深度学习
2020-01-25 18:05

回答 2 已采纳 https://blog.csdn.net/qq_32241189/article/details/80450741
C++初学者遇到问题 c++ 学习方法
2022-10-12 22:59

回答 3 已采纳 user_name去掉引号
前端初学者在line-height所遇到的问题 css html5
2022-03-09 14:47

回答 2 已采纳不会额打脸了会继承 line-height的继承性，height line-height 背景填充的方式_JiM-W 的博客-CSDN博客_line-hei
实战深度学习：掌握AI大模型的构建与优化技巧【文末赠书】
2024-07-27 15:02

AI大模型-王哥的博客在人工智能领域的不断发展中，构建和优化大规模深度学习模型已经成为一项引人注目的技术挑战。本文将深入探讨构建和优化AI大模型的关键技术，并提供具体的代码实例，帮助读者更好地理解和应用这些技术。
初学者在C语言的中一些问题 c语言
2022-08-31 23:06

回答 3 已采纳第3行：scanf_s("%s%s",ass,asss,40); 修改为：scanf_s("%s%s",ass,40,asss,40);
深度学习与硬件GPU，软件框架关系及相关概念解析
2017-11-21 21:12

Naruto_Q的博客套用：人工智能，深度学习，机器学习……不管你在从事什么工作，都需要了解这些概念。否则的话，三年之内你就会变成一只恐龙。 —— 马克·库班本篇主要是为了在学习机器学习和深度学习之前进行一些扫雷性质的...
对人工智能的一些思考和给初学者的建议
2020-06-10 21:26

Yzy_Carlisle的博客 "THE TRUE SIGN OF INTELLIGENCE IS NOT KNOWLEDGE BUT IMAGINATION....很开心在我的学术生涯道路上得到了许多老师和同事的帮助，使得我能够在漫长的人工智能发展历史中，留下属于我自己的一笔痕迹。.
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月10日

悬赏问题

¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见
¥15 一共有五道问题关于整数幂的运算还有房间号码还有网络密码的解答？(语言-python)
¥20 sentry如何捕获上传Android ndk 崩溃
¥15 在做logistic回归模型限制性立方条图时候，不能出完整图的困难
¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动，如何解决？

初学者在深度学习中遇到的有关gpu计算的困惑

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新