悠然时光 2019-01-16 16:58 采纳率: 100%
浏览 1330
已采纳

cuda核函数不执行的可能原因?

练习中遇到一个问题,核函数不执行,不知道原因?
typedef struct
{
int x;
int y;
}TstRst;

typedef struct
{
int x;
int y;
int z;
}TstDat;

device int TstDeviceFun(const int * pData1, const int * pData2)
{
return 100;
}

global void Kernel_Tst(TstRst*pRsts, const TstDat *pDats, const int nCount)
{
int i = threadIdx.x;
pRsts[i].y = 100;

return;

}
main里的相关调用如下
int nCount = 200;
TstRst*pTstRsts;
TstDat pTstDats;
TstRst*pAjustRsts = (TstRst
)malloc(nCount * sizeof(TstRst));
TstDat*pAjustDats = (TstDat*)malloc(nCount * sizeof(TstDat));
memset(pAjustRsts, 0, nCount * sizeof(TstRst));
memset(pAjustDats, 0, nCount * sizeof(TstDat));

cudaMalloc((void**)&pTstRsts, nCount * sizeof(TstRst));
cudaMemcpy(pTstRsts, pAjustRsts, nCount * sizeof(TstRst), cudaMemcpyHostToDevice);

cudaMalloc((void**)&pTstDats, nCount * sizeof(TstDat));
cudaMemcpy(pTstDats, pAjustDats, nCount * sizeof(TstDat), cudaMemcpyHostToDevice);

Kernel_Tst <<<1, 100 >>>(pTstRsts, pTstDats, 100);
cudaStatus = cudaMemcpy(pAjustRsts, pTstRsts, nStockCount * sizeof(StockCoorInfo), cudaMemcpyDeviceToHost);
cudaStatus = cudaThreadSynchronize();
  • 写回答

2条回答

      报告相同问题?

      相关推荐 更多相似问题

      悬赏问题

      • ¥15 unity 使用 Vuforia 导入Model target 成功后database下拉菜单不显示导入的内容
      • ¥15 VBA跨工作簿获取目标工作簿内已有数据的列号
      • ¥30 Dijkstra‘s 最短路径
      • ¥15 在线教育培训平台,主要以点播视频和在线练习测试为主,除将视频做切片外,有其他哪种方式降低流量?(关键词-带宽速率)
      • ¥20 用c语音或c++实现银行叫号系统
      • ¥15 人工智能 规则正向演绎和推理
      • ¥20 基于STM32F401的电子密码锁设计
      • ¥15 famamacbeth回归中遇到only size-1 arrays can be converted to Python scalars,求解答
      • ¥15 单片机多个自锁按键的编程实践
      • ¥15 用python操作redis存储中文后,再取出的数据变成了乱码怎么办?