这是设备端代码,将tmp0中的数据移动到arr数组中。每个块256个线程,块的数量根据输入的n划分,不过我不知道这有没有关系。。。。求各位解答。。。。。。。。。。
一个cuda代码,不明白哪里有错,请指教
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- yangbo50304 2017-06-09 01:40关注
__syncthreads 是所有一个block内所有线程运行到这里后才往下运行。你放到for循环里,是不是就错了呢?
按照你所述的需求,就不应该有for语句。__global_ void test(int* arr, int* tmp0) { int tid = blockDim.x*blockIdx.x+threadIdx.x; arr[tid] = tmp0[tid]; }
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 做个有关计算的小程序
- ¥15 MPI读取tif文件无法正常给各进程分配路径
- ¥15 如何用MATLAB实现以下三个公式(有相互嵌套)
- ¥30 关于#算法#的问题:运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题 求各位帮我解答一下
- ¥15 setInterval 页面闪烁,怎么解决
- ¥15 如何让企业微信机器人实现消息汇总整合
- ¥50 关于#ui#的问题:做yolov8的ui界面出现的问题
- ¥15 如何用Python爬取各高校教师公开的教育和工作经历
- ¥15 TLE9879QXA40 电机驱动
- ¥20 对于工程问题的非线性数学模型进行线性化