cuda核函数不执行的可能原因？

练习中遇到一个问题，核函数不执行，不知道原因？
typedef struct
{
int x;
int y;
}TstRst;

typedef struct
{
int x;
int y;
int z;
}TstDat;

device int TstDeviceFun(const int * pData1, const int * pData2)
{
return 100;
}

global void Kernel_Tst(TstRst*pRsts, const TstDat *pDats, const int nCount)
{
int i = threadIdx.x;
pRsts[i].y = 100;

return;

}
main里的相关调用如下
int nCount = 200;
TstRst*pTstRsts;
TstDat pTstDats;
TstRst*pAjustRsts = (TstRst)malloc(nCount * sizeof(TstRst));
TstDat*pAjustDats = (TstDat*)malloc(nCount * sizeof(TstDat));
memset(pAjustRsts, 0, nCount * sizeof(TstRst));
memset(pAjustDats, 0, nCount * sizeof(TstDat));

cudaMalloc((void**)&pTstRsts, nCount * sizeof(TstRst));
cudaMemcpy(pTstRsts, pAjustRsts, nCount * sizeof(TstRst), cudaMemcpyHostToDevice);

cudaMalloc((void**)&pTstDats, nCount * sizeof(TstDat));
cudaMemcpy(pTstDats, pAjustDats, nCount * sizeof(TstDat), cudaMemcpyHostToDevice);

Kernel_Tst <<<1, 100 >>>(pTstRsts, pTstDats, 100);
cudaStatus = cudaMemcpy(pAjustRsts, pTstRsts, nStockCount * sizeof(StockCoorInfo), cudaMemcpyDeviceToHost);
cudaStatus = cudaThreadSynchronize();

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
悠然时光 2019-01-17 11:27
关注
已解决，因为在窗口系统下，Kernel函数的执行有时间限制，Kernel函数执行时间过长而出错了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

cuda核函数不执行的可能原因？ c语言
2019-01-16 16:58

回答 2 已采纳已解决，因为在窗口系统下，Kernel函数的执行有时间限制，Kernel函数执行时间过长而出错了
cuda核函数奇怪的问题？ c语言
2019-01-17 11:06

回答 1 已采纳已解决，因为在窗口系统下，Kernel函数的执行有时间限制，Kernel函数执行时间过长而出错了
在cuda编程中，一个核函数最多可以用多少个线程？ c++ c语言有问必答
2022-04-24 20:17

回答 2 已采纳调用核函数的时候，可以有多个block，，每个block所能容纳的最大线程数也是有限的。其实在硬件上，每个block里面的所有thread会共用一个处理器核心，而且它们共享的shared memory
c语言 cuda核函数,CUDA编程
2021-05-22 07:17

weixin_39811842的博客 1核函数定义：在GPU进行的函数通常称为核函数一般通过__global__修饰(在核函数里，都用双下划线来修饰)，调用通过<<>>，第一个参数代表block线程块数目，第二个参数代表线程块内含有的线程数目thread。...
在较大规模计算中，cuda核函数中执行配置的线程数量为20万，程序可以运行。若想要运行更多的线程数量，有哪些解决方案？ c++ pytorch 有问必答神经网络
2022-04-25 22:11

回答 1 已采纳单卡的话也可以尝试对数据进行分割，多次传入GPU计算。GeForce RTX 3060 有 3,584 CUDA core，要是追求CUDA core的数量的话可以考虑RTX A40, RTX A60
cuda编程中，一个核函数可以最多运行多少个thread c++ 有问必答
2022-04-24 19:06

回答 2 已采纳 CUDA-Threadhttps://wenku.baidu.com/view/c3da123e2179168884868762caaedd3383c4b57a.html
Nvida GEforce GTX 1650支不支持CUDA编程吗？ c++
2019-07-17 11:27

回答 6 已采纳经过自己测试（可以在visual studio上编写CUDA程序），确实是支持的。
NVIDIA CUDA2023春训营（二）CUDA 核函数
2023-02-06 20:53

Alex_McAvoy的博客 NVIDIA CUDA2023春训营
目前rtx3070 是不是不支持cuda11之前tensorflow的版本？ tensorflow 深度学习
2021-12-06 21:24

回答 1 已采纳不会啊，3090都能跑tf1.14的，3070为啥跑不了，一般只跟你装的cuda版本有关
cuda编程数据传输 c++ 有问必答
2022-07-13 15:45

回答 2 已采纳可以看一下下面这篇文章： CUDA编程记之一基本使用及线程、同步、存储器_辜易的博客-CSDN博客_cuda 线程同步欢迎大家一起来观摩我
安装了cuda,为啥VS2013里面没有cuda模块？
2017-06-10 16:27

回答 2 已采纳后来重装cuda8.0时发现，应该先安装VS2013然后才安装cuda8.0，因为安装cuda8.0时，它会配置VS2013，如果安装顺序相反，则新建项目的时候，没有nvidia模块。
CUDA+C+++Programming+Guide-已翻译 CUDA C++编程指南
2024-01-26 11:38

- **单指令多线程（SIMT）**：CUDA的核心编程模型是SIMT，每个CUDA线程执行相同的指令，但可以独立调度和执行。 - **异步执行**：CUDA支持异步操作，这意味着可以同时进行多个计算任务，以充分利用GPU资源，提高...
GPU编程 CUDA C++ 用非默认CUDA流重叠多个核函数在GPU中并发执行
2023-04-02 21:44

温柔的行子的博客 1. 核函数计算与数据传输之间的并行。4. 核函数计算与主机计算之间的并行。2. 主机计算与数据传输之间的并行。3. 不同的数据传输之间的并行。5. 不同核函数之间的并行。
C++ GPU编程(英伟达CUDA)
2024-06-21 20:43

CUDA是Compute Unified Device Architecture的缩写，它为开发者提供了一个全面的、高效的编程模型，用于在GPU上执行通用计算任务，而不仅仅是图形渲染。 1. **GPU编程基础**：GPU最初设计是用来加速图形处理的，但...
没有解决我的问题, 去提问

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

cuda核函数不执行的可能原因？

2条回答 默认 最新

悬赏问题

2条回答默认最新