CUDA 指针结构体中的结构体成员指针拷贝到设备端问题

在VS中将算法改为CUDA运行时遇到的问题：

我的GPU为GTX 1650 Ti，准备改动的一个视频运动目标检测算法，在将结构体指针传输到设备端时遇到了问题，首先是一个模型结构体，其中有一个像素结构体指针，像素结构体中含有 char 型指针；代码如下：

typedef struct
{
    unsigned char* samples;
    unsigned int numberOfSamples;
    unsigned int sizeOfSample;
}pixel;

typedef struct
{
    pixel* pixels;
    unsigned int width;
    unsigned int height;
    unsigned int stride;
    //样本大小
    unsigned int numberOfSamples;
    //匹配阈值
    unsigned int matchingThreshold;
    //匹配的个数
    unsigned int matchingNumber;
    unsigned int updateFactor;
}vibeModel;

model = (vibeModel*)calloc(1, sizeof(vibeModel));
model->pixels = (pixel*)calloc(model->width * model->height, sizeof(pixel));
    for (unsigned int i = 0; i < model->width * model->height; i++)
    {

        model->pixels[i].samples = (unsigned char*)calloc(30, sizeof(unsigned char));

    }

开始是使用了统一内存cudaMallocManaged（）直接在开辟时使用，这样不需要cudaMemcpy（）了，这样改动后确实可以成功运行了，但是只能跑200*200像素的图像，超过了这个大小就提醒 addKernel launch failed: an illegal memory access was encountered ；用张1000*1000图片测试网格大小设置及核函数没有问题，那么请问是不是cudaMallocManaged（）分配的哪一部分的空间，应该和cudaMalloc（）不一样吧，我显存4G的应该够用。

第一个问题就是使用cudaMallocManaged（）分配能正常处理200*200图像，超过了后像300*300，500*500 就报错illegal memory access was encountered ，请问有什么解决办法。

cudaMallocManaged(&model->pixels, model->width * model->height * sizeof(pixel));

cudaMallocManaged(&model->pixels, model->width * model->height * sizeof(pixel));
    for(){
cudaMallocManaged(&model->pixels[i].samples, model->numberOfSamples * sizeof(unsigned char));
}

上面的第一个问题我猜测是cudaMallocManaged（）能分配的空间不够，所以想正常cudaMalloc（）然后cudaMemcpy（）到设备端，但是这个结构体指针一直拷贝不成功，查网上资料结构体成员拷贝介绍多为1个结构体，然后成员指针是多个，对其参考下，我是准备将width*height 个像素结构体pixel, 每个pixel中有30个char,这些进行拷贝，代码如下：

model = (vibeModel*)calloc(1, sizeof(vibeModel));
model->pixels = (pixel*)calloc(model->width * model->height, sizeof(pixel));
    for (unsigned int i = 0; i < model->width * model->height; i++)
    {

        model->pixels[i].samples = (unsigned char*)calloc(30, sizeof(unsigned char));

    }


 pixel* pix;
 cudaMalloc(&pix, enhanced.size().width * enhanced.size().height * sizeof(pixel));
        for (unsigned int i = 0; i < enhanced.size().width * enhanced.size().height; i++)
        {
            cudaMalloc((void**)&backgroundSubtract.model->pixels[i].samples, sizeof(unsigned char) * 30);
            cudaMemcpy(&pix[i], &backgroundSubtract.model->pixels[i], sizeof(pixel),cudaMemcpyHostToDevice);
        }

会报错 addKernel launch failed: an illegal memory access was encountered ，请问多个结构体，各个结构体中附带指针的结构该如何拷贝到设备端呢，非常感谢！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2022-09-07 17:49
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
可以看下cpp参考手册中的 c++-指针

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
解决
无用 4
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

c语言结构体成员指针运算的问题
2020-04-07 15:55

回答 1 已采纳 ``` struct ff *p=(struct ff *)malloc(sizeof(struct ff)); 这里少一个ff 最后一行没问题 ```
C语言里怎么访问结构体指针里的结构体成员 c语言有问必答
2021-05-20 11:39

回答 3 已采纳假设结构体指针：Player *player;，使用为player->wares;player->wares[0]这样都可以。还有就是被引用的结构体最好在前面定义，也就是说Wares在Pa
使用指针输出结构体变量stu的成员name之值 c语言有问必答
2022-04-05 19:08

回答 3 已采纳 #include<stdio.h> int main(void) { struct student { int num; char name[10]; float score[3]; }
CUDA拷贝结构体成员指针
2019-07-14 15:14

SetDreamer的博客在网上看了好多CUDA中在拷贝结构体以及在内核中如何访问结构体成员变量的帖子，都没找到一个质量好的，so，自己写一个吧。。。先来个结构体： struct Stu_Struct{ int count; //人数 short* score; //每...
结构体变量指针指向结构体成员指针的问题 c语言有问必答
2022-03-15 10:21

回答 4 已采纳 A,B,C,D选项信息你能用代码块贴出来吗？你这么贴的话，看不清楚哪些有 * 号，哪些没有。应该是C选项开头有个 * ，D选项开头有个 *总体看的话，确实B是错的A: p是指针，用->访问成员没
结构体指针为NULL和结构体的成员指针为NULL的区别 c++ c语言
2022-06-18 20:58

回答 1 已采纳如果从逻辑含义上来看的话，p代表首节点或当前节点，p->pnext代表当前节点的下一个节点，p为NULL代表当前节点为空，p->pnext为NULL代表当前节点的下一个节点为空，一般代表用
结构体中指针指向的问题 c语言
2021-10-07 17:05

回答 3 已采纳因为结构体里， char *name; name定义的是个指针变量，定义结构体对象时，并没有分配额外的空间给它们，改了下，供参考： ```c++ #include<stdio.h> st
CUDA:将含有多级指针的结构体指针传入设备，并在设备中
2023-03-20 22:08

致远的方的博客将多级指针的数据传入gpu，并且同时传入指向关系，可以在设备中通过指针访问数据
c++ 如何free泛型结构体成员指针 c++ qt 有问必答
2021-10-12 17:05

回答 3 已采纳一种方法是在free前手动释放if(p->str) {free(p->str); p->str = 0;}free(p);另一种方法是，给结构体添加析构函数（结构体是一种特殊的类，所
QT中 QByteArray数据转自定义结构体（含成员指针）能强转吗 qt 有问必答
2022-01-20 17:35

回答 3 已采纳 结构体中有指针的话不能直接强转，需要自己写个解析函数，按照报文格式，逐个字段解析出来放到结构体中。题外话：如果结构体中没有指针，如果在发送端发送的时候，直接用结构体取地址的方式发送，那么在接收端就
结构体指针初始化问题
2015-10-13 04:16

回答 4 已采纳 main.cpp ``` #include "Queue.h" void testQueue1(); void testQueue2(); void testQueue3();
cuda-将设备的指针拷贝到同一个设备的指针
2024-06-23 00:28

weixin_40826634的博客上述代码中即是将cuda中的bev_model_feature_output1指针拷贝到cuda中的fusion_model_feature_input1指针中。tensorRT推理时，输入输出指针都位于设备上，所以设备上的指针之间的拷贝需要使用cuda的拷贝指令，不能...
请教C语言结构体中指针的问题 c语言
2023-04-23 14:26

回答 4 已采纳在结构体定义中，可以使用常量表达式初始化成员，但不能使用变量，因为在编译时无法确定变量的值。对于指针类型的成员，初始化时必须为其分配一个内存空间。因此，可以改为以下方式初始化： person C =
CUDA传递结构体数组
2017-09-22 12:05

林先生您好的博客在把CPU的数组结构体传递到GPU内存中需要好多问题,找不到太多的资料,最后只能靠自己慢慢摸索 CPU上的代码我们一般称为 Host代码 GPU上面的一般叫Device 代码,之所以这样区分是由于GPU的内存和CPU的内存是相互独立的,...
CUDA GPU编程中使用结构体传递函数参数
2017-10-12 09:48

命中缺汤的博客 CUDA GPU编程中使用结构体传递函数参数 CUDA GPU编程中，虽然统一寻址(Unified Memory)技术能够大大简化编程难度和代码复杂度，但是速度略有牺牲，同时对运行环境提出更多的要求。而在不使用这项技术时，编程...
没有解决我的问题, 去提问

悬赏问题

¥15 陆空双模式无人机怎么做
¥15 想咨询点问题，与算法转换，负荷预测，数字孪生有关
¥15 C#中的编译平台的区别影响
¥15 软件供应链安全是跟可靠性有关还是跟安全性有关？
¥15 电脑蓝屏logfilessrtsrttrail问题
¥20 关于wordpress建站遇到的问题！(语言-php)（相关搜索：云服务器）
¥15 【求职】怎么找到一个周围人素质都很高不会欺负他人，并且未来月薪能够达到一万以上（技术岗）的工作？希望可以收到写有具体，可靠，已经实践过了的路径的回答？
¥15 Java+vue部署版本反编译
¥100 对反编译和ai熟悉的开发者。
¥15 带序列特征的多输出预测模型

CUDA 指针结构体中的结构体成员指针 拷贝到设备端问题

1条回答 默认 最新

悬赏问题

CUDA 指针结构体中的结构体成员指针拷贝到设备端问题

1条回答默认最新