CUDA-GPU加速-中值滤波-黑屏+显卡程序崩溃

新手刚接触CUDA C，这段中值滤波的代码一直跑不通，如果读取一张小图片（2790,2560）没有问题，如果读取一张大图片(5580,5120)，就会导致黑屏+没有结果。
我的显卡是NVIDIA Geforce 820M

#include <iostream>
#include "ImMedFilter.h"

#define DIM_GRID  128
#define DIM_BLOCK 16
using namespace std;

__device__ void mid(unsigned char* data, int size, int midIndex)
{   
    unsigned char temp = 0;
    for (int i = 0; i <= midIndex; i++)
    {
        for (int j = i+1; j < size; j++)
        {
            if (data[j] > data[i])
            {
                temp = data[i];
                data[i] = data[j];
                data[j] = temp;
            }
        }
    }    
}

__global__ void global_ZhongSmooth(unsigned char *dev_src, unsigned char *dev_dst, int width , int height, int bytesPerLine, int size, int markSize)
{
    int x = threadIdx.x + blockIdx.x*blockDim.x;
    int y = threadIdx.y + blockIdx.y*blockDim.y;

    int step_x = blockDim.x * gridDim.x;
    int step_y = blockDim.y * gridDim.y;


    for (int t_y = y; t_y < height - markSize; t_y = t_y + step_y)
    {
        if (t_y < markSize || t_y > height-markSize-1)
        {
            continue;
        }
        for (int t_x = x; t_x < width - markSize; t_x = t_x + step_x)
        {
            if (t_x < markSize || t_x > width-markSize-1)
            {
                continue;
            }
            unsigned int index = t_x + t_y*width;
            if( index < size )
            {       
                unsigned char len = (markSize*2+1)*(markSize*2+1);
                unsigned char midIndex = len/2;             
                // 创建保存中值区域的数组
                // size = (marksize * 2 + 1) ^ 2;
                // 滤波大小：3、5、7、9、...、29、31
                unsigned char*a = NULL;
                switch (markSize)
               {
                case 1:
                    unsigned char c[9]; 
                    a = c;  
                    break;
                case 2:
                    unsigned char d[25];    
                    a = d;  
                    break;
                case 3:
                    unsigned char e[49];    
                    a = e;  
                    break;
                case 4:
                    unsigned char f[81];    
                    a = f;  
                    break;
                case 5:
                    unsigned char g[121];   
                    a = g;  
                    break;
                case 6:
                    unsigned char h[169];   
                    a = h;  
                    break;
                case 7:
                    unsigned char v[225];   
                    a = v;  
                    break;
                case 8:
                    unsigned char w[289];   
                    a = w;  
                    break;
                case 9:
                    unsigned char x[361];   
                    a = x;  
                    break;
                case 10:
                    unsigned char z[441];   
                    a = z;  
                    break;
                case 11:
                    unsigned char u[529];   
                    a = u;  
                    break;
                case 12:
                    unsigned char q[625];   
                    a = q;  
                    break;
                case 13:
                    unsigned char i[729];   
                    a = i;  
                    break;
                case 14:
                    unsigned char o[841];   
                    a = o;  
                    break;
                default:
                    return;
                }
                unsigned char k = 0;
                for (int i = -markSize; i <= markSize; i++)
                {           
                    for (int j = -markSize; j <= markSize; j++)
                    {               
                        a[k++] = dev_src[t_x+j+(t_y+i)*width];
                    }           
                }

                mid(a, len, midIndex);   
                dev_dst[index] = a[midIndex];
            }
        }
    }


}


extern "C" void ImMedfilter(const unsigned char *host_src, unsigned char *host_dst, int width, int height, int bytesPerLine, int markSize)
{
    int dataSize = bytesPerLine * height;   

    unsigned char *dev_src = NULL;  
    unsigned char *dev_dst = NULL;


    cudaMalloc((void**) &dev_src, dataSize);
    cudaMalloc((void**) &dev_dst, dataSize);



    cudaMemset(dev_dst, 0, dataSize);
    cudaMemcpy(dev_src, host_src, dataSize, cudaMemcpyHostToDevice);


    dim3 blocks(DIM_BLOCK, DIM_BLOCK);
    dim3 grids(DIM_GRID, DIM_GRID);

    global_ZhongSmooth<<<grids, blocks>>>(dev_src, dev_dst, width, height, bytesPerLine, dataSize, markSize);

    cudaMemcpy(host_dst, dev_dst, dataSize, cudaMemcpyDeviceToHost);

    cudaFree(dev_src);
    cudaFree(dev_dst);  
}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
xcx1557 2015-08-03 10:10
关注
每次程序黑屏都是ImMedfilter函数运行了：
cudaMemcpy(host_dst, dev_dst, dataSize, cudaMemcpyDeviceToHost);
这一段代码后。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于python的加权中值滤波的实现 python
2022-07-22 00:37

回答 2 已采纳 import numpy as np import cv2 as cv def median_filter(input_image, kernel, stride=1, padding=False
C语言中值滤波数组数组 c语言
2022-11-28 16:41

回答 2 已采纳很简单的，不明白说明是什么意思。另存数组自己去写，对照：
java问题，下面像素的图像，分别通过中值和均值滤波会得到什么样的结果 java
2021-11-29 13:11

回答 2 已采纳 # 根据理解写的中值滤波 import numpy as np def MedianValue(src, row, col, scale, size): tmpList = []
OpenCV-Python学习资源
2020-07-07 13:50

一只干巴巴的海绵的博客 gpu：包含了一些gpu加速的接口，底层的加速是CUDA实现。 photo：计算摄像学（Computational Photography）相关的接口，当然这只是个名字，其实只有图像修复和降噪而已。 stitching：图像拼接模块，有了它可以自己...
matlab编写L1中值点云骨架提取程序 matlab
2023-03-07 21:00

回答 8 已采纳 L1中值算法提取比较全的可以看github的程序，一个是Python的程序：https://github.com/MarcSchotman/skeletons-from-poincloud/blob/
case5排序的值会出现-1和0，case6求的中值不是正确的结果，如何修改 c语言 python 其他蓝桥杯
2022-03-26 19:43

回答 1 已采纳修改处见注释，供参考： #include <stdio.h> #include <stdlib.h> #include <windows.h> #define SI
选择列表中值的第一个外观（DISTINCT / GROUP BY） mysql php sql
2014-07-24 17:08

回答 2 已采纳 You can try this if SQL Server 2008+ (sqlfiddle: http://sqlfiddle.com/#!3/0bc33/3): WITH cteOrder
给深度学习入门者的Python快速教程 - 番外篇之Python-OpenCV
2017-08-11 10:32

Trent1985的博客 - gpu：包含了一些gpu加速的接口，底层的加速是CUDA实现。 - photo：计算摄像学（Computational Photography）相关的接口，当然这只是个名字，其实只有图像修复和降噪而已。 - stitching：图像拼接模块，有了它可以...
C++程序中值突然改变的问题，CodeBlocks 17.12，win10 c++
2018-04-24 13:06

回答 2 已采纳 ![图片说明](https://img-ask.csdn.net/upload/201804/24/1524576337_606252.png) 感觉这个输出没问题啊，输入数字，执行第二个 Q.di
数据库中数据表对表中值进行唯一性（表名：wqq mysql 有问必答
2022-09-28 22:03

回答 4 已采纳 alter table 表名 change 键名键名新的类型; 应该是这样的，但是看你上面的语句却是：alter table wqq change iqqname iqqname tinyin
在vue中插值时{{msg}}中值不变 vue.js
2023-03-14 12:27

回答 1 已采纳你 vue.js都每引入加上这个 <script src="https://cdn.jsdelivr.net/npm/vue@2.6.14/dist/vue.js"></scri
红胖子网络科技博文大全：开发技术集合（包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软硬结合等等）持续更新中...
2021-01-15 15:46

长沙红胖子Qt的博客《案例分享：Qt+Android模拟操作器（模拟操作app，打开，点击，输入，获取验证码等等）》《案例分享：Qt流水线图像显示控件（列刷新、1ms一次、缩放、拽拖、拽拖预览、性能优化、支持OpenGL GPU加速）》《案例分享...
输出4×5矩阵中值最小的元素值 c语言
2022-10-26 21:46

回答 2 已采纳 for(i=0;i<4;i++)scanf("%d",&a[i][j]);if(min > a[i][j])
Python-opencv实现Data Augmentation
2019-04-15 10:59

weixin_33851177的博客本篇是前面两篇教程：给深度学习入门者的Python快速...本篇将介绍和深度学习数据处理阶段最相关的基础使用，并完成4个有趣实用的小例子：- 延时摄影小程序- 视频中截屏采样的小程序- 图片数据增加（data augmentati...
深度学习与计算机视觉-6章 Python-OpenCV
2019-03-02 17:20

javastart的博客给深度学习入门者的Python快速教程 - 番外篇之Python-OpenCV ... 的番外篇，因为严格来说不是在讲Python而是讲在Python下使用OpenCV。本篇将介绍和深度学习数据处理阶段最相关...- 延时摄影小程序 - 视频中截屏采样的...
深度学习与计算机视觉：实例入门-第六章
2019-04-03 12:41

javastart的博客 - gpu：包含了一些gpu加速的接口，底层的加速是CUDA实现。 - photo：计算摄像学（Computational Photography）相关的接口，当然这只是个名字，其实只有图像修复和降噪而已。 - stitching：图像拼接模块，有了...
转载:QT实用技巧
2020-12-19 18:21

天问XUiRH的博客《项目实战：Qt+Android模拟操作器（模拟操作app，打开，点击，输入，获取验证码等等）》《项目实战：Qt流水线图像显示控件（列刷新、1ms一次、缩放、拽拖、拽拖预览、性能优化、支持OpenGL GPU加速）》《项目实战...
OpenCV学习
2018-07-24 15:07

键盘里的青春的博客另一篇参考文献：中文手册转自：打开链接本篇是前面两篇教程：给深度学习入门者的Python快速教程 - 基础篇给深度学习入门者的Python快速教程 - numpy和Matplotlib篇 ...- 延时摄影小程序 - 视频中...
OpenCV 基础笔记
2018-11-21 18:04

weixin_30491641的博客延时摄影小程序视频中截屏采样的小程序图片数据增加（data augmentation）的小工具物体检测框标注小工具 1 OpenCV 简介 OpenCV 是计算机视觉领域应用最广泛的开源工具包，基于 C/C++，支持 L...
没有解决我的问题, 去提问

悬赏问题

¥15 Matlab怎么求解含参的二重积分？
¥15 苹果手机突然连不上wifi了？
¥15 cgictest.cgi文件无法访问
¥20 删除和修改功能无法调用
¥15 kafka topic 所有分副本数修改
¥15 小程序中fit格式等运动数据文件怎样实现可视化？（包含心率信息））
¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops？
¥40 串口调试助手打开串口后,keil5的代码就停止了
¥15 电脑最近经常蓝屏，求大家看看哪的问题
¥60 高价有偿求java辅导。工程量较大，价格你定，联系确定辅导后将采纳你的答案。希望能给出完整详细代码，并能解释回答我关于代码的疑问疑问，代码要求如下，联系我会发文档