cuda核函数不执行的可能原因？

练习了一个矩阵乘法的例子，每个block配置16×16个thread，
当做5000×5000的矩阵乘法时，结果就全为0，核函数不执行不知道原因是什么？
每个grid每一维可以包含至少65535个block，算了下没有超出但是核函数没执行。。。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2018-07-15 09:00
关注
代码是在设备上运行的么，没有使用主机变量吧，没有爆内存吧，还有驱动程序对不对。你可以先测试自带的例子程序，排除环境问题。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

报告相同问题？

关注问题

cuda核函数不执行的可能原因？ c语言
2019-01-16 16:58

回答 2 已采纳已解决，因为在窗口系统下，Kernel函数的执行有时间限制，Kernel函数执行时间过长而出错了
cuda核函数奇怪的问题？ c语言
2019-01-17 11:06

回答 1 已采纳已解决，因为在窗口系统下，Kernel函数的执行有时间限制，Kernel函数执行时间过长而出错了
在较大规模计算中，cuda核函数中执行配置的线程数量为20万，程序可以运行。若想要运行更多的线程数量，有哪些解决方案？ c++ pytorch 有问必答神经网络
2022-04-25 22:11

回答 1 已采纳单卡的话也可以尝试对数据进行分割，多次传入GPU计算。GeForce RTX 3060 有 3,584 CUDA core，要是追求CUDA core的数量的话可以考虑RTX A40, RTX A60
CUDA核函数
2024-04-25 13:23

A11en3的博客一个CUDA函数的调用<<<>>>中间的部分，是核函数的运行配置。执行配置的第一个值是网格维度，也就是启动块的数目；第二个值是块维度，也就是每个块中线程的数目。由于数据在全局内存中是线性存储的，因此可以用变量...
在cuda编程中，一个核函数最多可以用多少个线程？ c++ c语言有问必答
2022-04-24 20:17

回答 2 已采纳调用核函数的时候，可以有多个block，，每个block所能容纳的最大线程数也是有限的。其实在硬件上，每个block里面的所有thread会共用一个处理器核心，而且它们共享的shared memory
cuda编程中，一个核函数可以最多运行多少个thread c++ 有问必答
2022-04-24 19:06

回答 2 已采纳 CUDA-Threadhttps://wenku.baidu.com/view/c3da123e2179168884868762caaedd3383c4b57a.html
Nvida GEforce GTX 1650支不支持CUDA编程吗？ c++
2019-07-17 11:27

回答 6 已采纳经过自己测试（可以在visual studio上编写CUDA程序），确实是支持的。
CUDA kernel函数不执行、不报错的问题
2022-02-08 17:00

莫翰轩 MoDonald的博客 CUDA 核函数不执行、不报错的问题最近使用CUDA的时候发现了一个问题，有时候kernel核函数既不执行也不报错。而且程序有时候可以跑，而且结果正确；有时候却不执行，且不报错，最后得到错误的结果。这种情况一般是...
目前rtx3070 是不是不支持cuda11之前tensorflow的版本？ tensorflow 深度学习
2021-12-06 21:24

回答 1 已采纳不会啊，3090都能跑tf1.14的，3070为啥跑不了，一般只跟你装的cuda版本有关
tensorflow2.8.0对应的cuda版本应该是多少？ tensorflow 深度学习
2022-05-06 13:21

回答 2 已采纳 11.3
图像识别代码添加cuda后跑不起来 python pytorch 机器学习
2022-07-26 10:18

回答 3 已采纳 Expected all tensors to be on the same device。也就是说，有的data在cpu上，而有的在cuda上。通过观察代码可以发现你的model是cuda对象，但是
c语言 cuda核函数,CUDA核函数与线程配置
2021-05-22 07:17

maxil wu的博客 CUDA核函数在GPU上调用的函数成为CUDA核函数(Kernel function)，核函数会被GPU上的多个线程执行。每个线程都会执行核函数里的代码，当然由于线程编号的不同，执行的代码路径可能会有所不同。下面的几行代码是向量加...
怎么修改CUDA核函数的执行时间限制
2021-01-14 15:43

并行遥感的博客怎么修改CUDA核函数的执行时间限制？请安装CUDA 5.5, 然后从开始菜单中找到nsight monitor, 并用鼠标左键点击一下，启动它。然后从任务栏的通知区域的右下角的找到nsight monitor图标并右键单击——Options——...
cuda 显存错误导致核函数执行失败
2022-07-26 19:05

春风生_的博客 cuda 核函数执行失败
c语言 cuda核函数,CUDA编程
2021-05-22 07:17

weixin_39811842的博客 1核函数定义：在GPU进行的函数通常称为核函数一般通过__global__修饰(在核函数里，都用双下划线来修饰)，调用通过<<>>，第一个参数代表block线程块数目，第二个参数代表线程块内含有的线程数目thread。...
没有解决我的问题, 去提问

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

cuda核函数不执行的可能原因？

5条回答 默认 最新

悬赏问题

5条回答默认最新