一个cuda代码，不明白哪里有错，请指教

这是设备端代码，将tmp0中的数据移动到arr数组中。每个块256个线程，块的数量根据输入的n划分，不过我不知道这有没有关系。。。。求各位解答。。。。。。。。。。
图片说明

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
yangbo50304 2017-06-09 01:40
关注
__syncthreads 是所有一个block内所有线程运行到这里后才往下运行。你放到for循环里，是不是就错了呢？
按照你所述的需求，就不应该有for语句。

__global_ void test(int* arr, int* tmp0) { int tid = blockDim.x*blockIdx.x+threadIdx.x; arr[tid] = tmp0[tid]; }
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

新手友好 win10使用cmake3.17编译配置OpenCV3.4.1+CUDA10.2+VS2019
2020-04-07 16:58

orang_dragon的博客为了试试GPU能不能使数字识别的纯算法代码加速，而去配置了OpenCV+CUDA的环境。...同时，也欢迎大家进行补充，如果有不正确的地方，也请多指教。前提环境： Win10 VS2019 OpenCV3.4.1 CUDA10.2 CM...
双系统Linux（Ubuntu20.04）深度学习安装+cuda驱动+cuda+anaconda
2022-05-26 01:29

ybobob_的博客文章可能排布不好但请你耐心看完一定对你有所帮助因为我安装与卸载了n边感觉挺不容易的所以有感写下了这篇博客来帮助更多的小白因为是小白所以每走错一步我选择的就是卸载再重装如有大神还望评论区指教 ...
win11动手学深度学习安装过程（GPU版）（ CUDA Anaconda Mxnet )
2022-03-01 16:02

纳show的博客一、检查及安装CUDA 首先检查显卡支持的cuda：直接搜索NVIDIA，选择NVIDIA控制中心，可以看到NVIDIA支持的最高CUDA 然后是安装 https://developer.nvidia.com/cuda-toolkit-archive 选择需要的版本，我这里...
PyTorch 入门：训练一个深度神经网络(DNN)
2022-05-26 21:03

宁萌Julie的博客 pytorch入门笔记，训练深度神经网络(DNN)常用代码总结
初学者Tensorflow2.0第一个程序（含源码）
2021-08-23 15:18

微冷Lxy的博客小白初入门的时候还是踩了很多坑，所以以一个初学者的角度记录一下自己复现的第一个基于TensorFlow程序。由于并不是专业，可能多有不足，不过水平相近的话应该可以更好的分享经验，平时还有很多其他的工程软甲需要...
《程序员的自我修养》读书笔记——一个程序是如何运行起来的一：源代码怎么变成可执行文件
2020-04-11 15:47

羽翼__的博客程序员A 1 一个操作 2 跳转到第6行 3 一个操作 4 跳转到第9行 5 一个操作程序员B 6 一个操作 7 跳转到3 8 一个操作程序员C 9 一个操作 10 一个操作所以你现在明白了链接就是把1-10行连接起来。有的...
Qwen1.5-MoE-A2.7B-Chat如何从输入到输出-代码解析
2025-03-10 15:30

红酒暖心也暖胃的博客与Qwen1.5-14B-Chat如何从输入到输出-代码解析一致，这里使用的是RepetitionPenaltyLogitsProcessor，Deepseek-llm中的代码要做一下修改从输入到输出的逻辑是没有发生变化的。
人群计数[CAN](Context-Aware Crowd Counting) 代码解读
2021-04-18 13:34

自律，充实自己的博客现在对代码部分做一个详细解读，加深自己的理解，如果有不对的地方请大家多多指教！！（本文默认已经阅读过此篇论文并且对python的语法有一定的了解）代码分析可以看见里面有create_json.py、dataset.py、image....
tensorflow rnn代码
2018-06-22 15:29

SumResort_YangHao的博客一、学习单步的RNN：RNNCell如果要学习TensorFlow中的RNN，第一站应该就是去了解“RNNCell”，它是TensorFlow中实现RNN的基本单元，每个RNNCell都有一个call方法，使用方式是：(output, next_state) = call(input, ...
【我的第一个目标检测课题】1、课题介绍及环境配置（Windows+Keras+GPU）
2021-01-09 12:32

chenqah的博客这篇博客算是一个验收后的回顾与总结，也算是提前为正式写课题报告拟个提纲，或者说，把做过的事情，总结的经验都先归纳起来，到时候方便写报告。当然，如果能对同样刚刚入门目标检测的朋友能有所帮助的话，那就更好...
没有解决我的问题, 去提问

一个cuda代码，不明白哪里有错，请指教

2条回答 默认 最新

2条回答默认最新