cuda 报错 CUDA_ERROR_LAUNCH_FAILED

templateglobal void
pooling_max_kernel
(T* pooled,
const T* data,
const T* stochastic_value,
const int mode,
const int pooledWidth,
const int pooledHeight,
const int pooledVolume,
const int width,
const int height,
const int poolWidth,
const int poolHeight,
const int strideX,
const int strideY,
const int padLeft,
const int padTop)
{
int pooledIndex = threadIdx.x + blockIdx.x * blockDim.x;
int stochastic_value_index=0;
if (pooledIndex < pooledVolume) {
int px = pooledIndex ;
int py = px / pooledWidth ;
int pz = py / pooledHeight ;
px %= pooledWidth ;
py %= pooledHeight ;
data += pz * (width*height) ;

int x1 = px * strideX - padLeft ;
int y1 = py * strideY - padTop ;
int x2 = min(x1 + poolWidth, width) ;
int y2 = min(y1 + poolHeight, height) ;
x1 = max(x1, 0) ;
y1 = max(y1, 0) ;

//T *savedata;T *dataprob;
//cudaMalloc((void**)&savedata,sizeof(T)*9);cudaMalloc((void**)&dataprob,sizeof(T)*9);/////////////////////////////////////////////////定义变量分配内存
T savedata[9]={0};T dataprob[10]={0};dataprob[0]=0;
T sumdata=0;T weightsum=0;int i=0;/////////////////////////////lyz
//T bestValue = data[y1 * width + x1] ;
for (int y = y1 ; y < y2 ; ++y) {
  for (int x = x1 ; x < x2 ; ++x) {
    //bestValue = max(bestValue, data[y * width + x]) ;
    savedata[i]=data[y * width + x];
    sumdata=sumdata+data[y * width + x];
    i=i+1;
    if (i>8)
    {i=0;}
  }
}
if(mode==0)
{   
    T randdata = stochastic_value[pooledIndex];
    if (sumdata>0)
        {   for(int j=0;j<poolWidth*poolHeight;++j)
            {

                dataprob[j+1]=dataprob[j]+savedata[j]/sumdata;
               if (randdata<dataprob[j+1])
                    { stochastic_value_index=j;
                      break; }
            }
            pooled[pooledIndex] = savedata[stochastic_value_index] ;
        }
    else
    {
        pooled[pooledIndex] = 0 ;
    }
}
else
{
    if (sumdata>0)
        {   for(int j=0;j<poolWidth*poolHeight;++j)
            {

                weightsum=weightsum+savedata[j]*savedata[j]/sumdata;

            }
            pooled[pooledIndex] = weightsum ;
        }
    else
    {
        pooled[pooledIndex] = 0 ;
    }
}
//cudaFree(savedata);cudaFree(dataprob);

}
}
另，在kernel函数中定义变量需要分配内存吗，我之前用注释掉的那个分配内存，编译的时候回报错

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
_1_1_7_ 2016-06-13 01:35
关注
但是对于kernel函数，没有返回cudaerror，这个时候检查错误，需要用到，
cudaError_t err = cudaGetLastError();
printf("%s\n",cudaGetErrorString(err));
打印出最近出的错。

too many resources requested for launch 出现这种情况，有可能是kernel中smem或者register使用超过了限制。在编译的时候可以用--ptxas-options=-v,这样在编译过程中，会打印出你程序中每个核函数register和memory的使用情况。一般有以下两种解决办法：（1）设定max register的限定：编译时加入 -maxrregcount = 24，限定每个线程只能使用24（根据个人情况定）个register，多出的直接使用local memory代替（2）减少每个block的线程数。register是针对block有个总量，如果block数减少了，每个线程使用的reg数就增多了。
解决 1
无用
评论打赏
分享
举报
1人已打赏

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

args = parser.parse_args()报错 opencv python vscode
2022-04-26 12:29

回答 5 已采纳不知道你用的哪个库，有一个库是这么用的：import argparseparser = argparse.ArgumentParser()
VS code运行html文件报错launch 前端
2022-09-21 15:02

回答 2 已采纳写的很明白..说你的电脑没安装浏览器请重新安装或者在你的.json文件中把浏览器的绝对路径添加进去
CUDA kernel函数内for循环引发unspecific launch failure
2017-02-15 15:03

回答 3 已采纳用代码测试了下，跟release没有关系，上网搜索了下，好像是kernel运行超时导致kernel直接退出了。你用nsight打开option，修改下General->WDDM TDR Di
cuda_error_launch_failed: unspecified launch failure
2021-11-25 15:11

shu616048151的博客问题：error polling for event status: failed to query event: cuda_error_launch_failed: unspecified launch failure 问题排查：之前我的电脑在深度学习的时候，每次训练好几个epoch之后直接自动退出程序无法...
Golang调用CUDA库 c++
2016-03-02 21:47

回答 1 已采纳 It appears, at least in this case, that the go import of C is expecting the function to be provid
livox mid40用livox_ros_driver时报错In lidar mode, couldn't connect a hub怎么解决 c++ 人工智能
2022-05-25 21:12

回答 1 已采纳连接hub要用“roslaunch livox_ros_driver livox_hub.launch”，并提前修改配置文件/catkin_ws/src/livox_ros_driver/livox_
launch.json报错 c语言
2022-10-28 17:59

回答 1 已采纳
CUDA_ERROR_LAUNCH_TIMEOUT报错
2020-03-01 12:14

upDiff的博客当使用tensorflow-gpu进行模型训练时，出现的"CUDA_ERROR_LAUNCH_TIMEOUT"的报错，解决思路如下：检查CUDA, CuDNN, Tensorflow版本是否对应以及兼容运行简单代码 import tensorflow as tf zeros= tf.zeros([10,...
eclipse运行出现launch error，而以前的文件可以正常运行，修改了eclipse.ini之后打不开eclipse eclipse java 数据库
2022-03-10 17:16

回答 3 已采纳是的，我输入错误导致打不开eclipse，改了之后能打开了，但是还是又launch error的错误请问你知道如何解决吗
novelAI搭建launch.py运行报错 git python
2022-12-08 21:21

回答 2 已采纳从git clone项目到本地时出错了，你看一下是不是开了代理，将代理关闭再试一下。
openstack创建实例成功但是启动实例报错 centos linux vim 云计算
2020-02-11 09:54

回答 3 已采纳将你的操作系统的语言/区域，全部设置为美国/英语 EN-US windows是在控制面板里面设置，linux参考 https://blog.csdn.net/zhouxun623/article/d
failed to query event :CUDA_ERROR_LAUNCH_FAILED:unspecified launch failure
2020-08-11 14:57

一位不愿暴露自己的小可爱的博客 failed to query event :CUDA_ERROR_LAUNCH_FAILED:unspecified launch failure 查了一下，这种错误代码没问题，问题出在windows，是运行时间过长，可以再运行几次试试，如果还报同样的错误可以参考博客解决办法：...
用YOLOX训练自己的数据集报错目标检测计算机视觉
2021-11-29 22:24

回答 1 已采纳 cuda的问题把，最后那句报错的意思就是希望用逗号能够分离两个变量出来，但是只分离得到了一个。也就是说最大的可能性就是你的cuda或者cudnn没有安装好。正常情况下报错语句上面的那行命令，执行命
运行GPU出现CUDA_ERROR_LAUNCH_FAILED
2018-09-21 15:46

Takoony的博客加入了：os.environ["CUDA_VISIBLE_DEVICES"] = '0' export CUDA_VISIBLE_DEVICES=0 ...后期又出现：CUDA_ERROR_LAUNCH_FAILED；解决方法如下：将8.0改成9.0，最后reboot就OK了...
CUDA_ERROR_LAUNCH_TIMEOUT
2020-02-13 12:01

guo mingyu的博客 CUDA_ERROR_LAUNCH_TIMEOUT 原因是由于现存内核执行时间过长导致，内存分配无效解决办法现在没有特别行之有效的办法，因为是硬件设备的原因导致的内存分配无效，建议更换硬件。参考 ...
有关win10中tensorflow出现CUDA_ERROR_LAUNCH_FAILED问题的解决办法
2019-12-10 17:08

HPU_CPD的博客有关win10中tensorflow出现CUDA_ERROR_LAUNCH_FAILED问题的解决办法本人之前是可以跑通的，但后面训练时训练一段时间就出现上述问题，然后网上找各种方法进行解决，但是都不行，比如升级cuda对应的cudnn版本，重新...
tensorflow2.4.0 解决CUDA报错：unspecified launch failure
2023-02-26 10:59

PerfectGirl9的博客 tensorflow2.4.0 解决CUDA报错：unspecified launch failure
没有解决我的问题, 去提问

悬赏问题

¥15 高德地图点聚合中Marker的位置无法实时更新
¥15 DIFY API Endpoint 问题。
¥20 sub地址DHCP问题
¥15 delta降尺度计算的一些细节，有偿
¥15 Arduino红外遥控代码有问题
¥15 数值计算离散正交多项式
¥30 数值计算均差系数编程
¥15 redis-full-check比较两个集群的数据出错
¥15 Matlab编程问题
¥15 训练的多模态特征融合模型准确度很低怎么办

cuda 报错 CUDA_ERROR_LAUNCH_FAILED

1条回答 默认 最新

悬赏问题

1条回答默认最新