一个cuda代码，不明白哪里有错，请指教

这是设备端代码，将tmp0中的数据移动到arr数组中。每个块256个线程，块的数量根据输入的n划分，不过我不知道这有没有关系。。。。求各位解答。。。。。。。。。。
图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
yangbo50304 2017-06-09 01:40
关注
__syncthreads 是所有一个block内所有线程运行到这里后才往下运行。你放到for循环里，是不是就错了呢？
按照你所述的需求，就不应该有for语句。

__global_ void test(int* arr, int* tmp0) { int tid = blockDim.x*blockIdx.x+threadIdx.x; arr[tid] = tmp0[tid]; }
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

一个cuda代码，不明白哪里有错，请指教
2017-06-08 16:09

回答 2 已采纳 __syncthreads 是所有一个block内所有线程运行到这里后才往下运行。你放到for循环里，是不是就错了呢？按照你所述的需求，就不应该有for语句。 ``` __global_
图像识别代码添加cuda后跑不起来 python pytorch 机器学习
2022-07-26 10:18

回答 3 已采纳 Expected all tensors to be on the same device。也就是说，有的data在cpu上，而有的在cuda上。通过观察代码可以发现你的model是cuda对象，但是
在cuda编程中，一个核函数最多可以用多少个线程？ c++ c语言有问必答
2022-04-24 20:17

回答 2 已采纳调用核函数的时候，可以有多个block，，每个block所能容纳的最大线程数也是有限的。其实在硬件上，每个block里面的所有thread会共用一个处理器核心，而且它们共享的shared memory
新手友好 win10使用cmake3.17编译配置OpenCV3.4.1+CUDA10.2+VS2019
2020-04-07 16:58

orang_dragon的博客为了试试GPU能不能使数字识别的纯算法代码加速，而去配置了OpenCV+CUDA的环境。...同时，也欢迎大家进行补充，如果有不正确的地方，也请多指教。前提环境： Win10 VS2019 OpenCV3.4.1 CUDA10.2 CM...
cuda不知道哪里出了问题 tensorflow 深度学习神经网络
2022-04-23 10:28

回答 1 已采纳 cuda和cudnn的版本必须匹配，可以查阅一下版本对照表
cuda编程中，一个核函数可以最多运行多少个thread c++ 有问必答
2022-04-24 19:06

回答 2 已采纳 CUDA-Threadhttps://wenku.baidu.com/view/c3da123e2179168884868762caaedd3383c4b57a.html
cuda运行错误，call to cuMemcpy failed, 返回错误代码700
2018-09-13 07:53

回答 1 已采纳 https://blog.csdn.net/u012348774/article/details/49663299
双系统Linux（Ubuntu20.04）深度学习安装+cuda驱动+cuda+anaconda
2022-05-26 01:29

ybobob_的博客文章可能排布不好但请你耐心看完一定对你有所帮助因为我安装与卸载了n边感觉挺不容易的所以有感写下了这篇博客来帮助更多的小白因为是小白所以每走错一步我选择的就是卸载再重装如有大神还望评论区指教 ...
cuda核函数不执行的可能原因？
2018-07-15 08:54

回答 5 已采纳代码是在设备上运行的么，没有使用主机变量吧，没有爆内存吧，还有驱动程序对不对。你可以先测试自带的例子程序，排除环境问题。
有两个源文件，运行只能运行第一个 c++
2021-10-11 14:27

回答 1 已采纳一个工程中，只能有一个main函数。main函数是程序的入口函数。你03文件中的函数是main2
nvcc -V和nvidia-smi的cuda 版本不一致 python pytorch
2022-10-07 21:33

回答 2 已采纳你可以认为nvidia的是显卡驱动支持安装最高的cuda版本，nvcc才是你的cuda版本。另外还有一个就是看下默认安装路径C:\Program Files\NVIDIA GPU Computing
win11动手学深度学习安装过程（GPU版）（ CUDA Anaconda Mxnet )
2022-03-01 16:02

纳show的博客一、检查及安装CUDA 首先检查显卡支持的cuda：直接搜索NVIDIA，选择NVIDIA控制中心，可以看到NVIDIA支持的最高CUDA 然后是安装 https://developer.nvidia.com/cuda-toolkit-archive 选择需要的版本，我这里...
pytorch 的安装。想不改动cuda版本 python pytorch 人工智能
2022-10-27 18:56

回答 2 已采纳 Pytorch-gpu版安装教程【注意：无需提前安装cuda和cudnn】_山风wind的博客-CSDN博客_pytorch一定要cuda吗
PyTorch 入门：训练一个深度神经网络(DNN)
2022-05-26 21:03

宁萌Julie的博客 pytorch入门笔记，训练深度神经网络(DNN)常用代码总结
初学者Tensorflow2.0第一个程序（含源码）
2021-08-23 15:18

微冷Lxy的博客小白初入门的时候还是踩了很多坑，所以以一个初学者的角度记录一下自己复现的第一个基于TensorFlow程序。由于并不是专业，可能多有不足，不过水平相近的话应该可以更好的分享经验，平时还有很多其他的工程软甲需要...
没有解决我的问题, 去提问

悬赏问题

¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 对于相关问题的求解与代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料

一个cuda代码，不明白哪里有错，请指教

2条回答 默认 最新

悬赏问题

2条回答默认最新