CUDA使用1维纹理内存，进行热传导模型计算

CUDA使用1维纹理内存，进行热传导模型计算
出现一大堆warning

#include "cuda.h"
#include "../common/cpu_anim.h"
#include"../common/book.h"
#include "../common/gpu_anim.h"
#include "../common/cpu_bitmap.h"
#define DIM 1024
#define PI 3.1415926535897932f
#define MAX_TEMP 1.0f
#define MIN_TEMP 0.0001f
#define SPEED   0.25f

texture<float>  texConstSrc;
texture<float>  texIn;
texture<float>  texOut;
__global__ void blend_kernel( float *dst,bool dstOut ) {
    int x = threadIdx.x + blockIdx.x * blockDim.x;
    int y = threadIdx.y + blockIdx.y * blockDim.y;
    int offset = x + y * blockDim.x * gridDim.x;

    int left = offset - 1;
    int right = offset + 1;
    if (x == 0)   left++;
    if (x == DIM-1) right--; 

    int top = offset - DIM;
    int bottom = offset + DIM;
    if (y == 0)   top += DIM;
    if (y == DIM-1) bottom -= DIM;

    float   t, l, c, r, b;
    if (dstOut) {
        t = tex1Dfetch(texIn,top);
        l = tex1Dfetch(texIn,left);
        c = tex1Dfetch(texIn,offset);
        r = tex1Dfetch(texIn,right);
        b = tex1Dfetch(texIn,bottom);
    }else{
        t = tex1Dfetch(texOut,top);
        l = tex1Dfetch(texOut,left);
        c = tex1Dfetch(texOut,offset);
        r = tex1Dfetch(texOut,right);
        b = tex1Dfetch(texOut,bottom);
    }
    dst[offset] = c + SPEED * (t + b + r + l - 4 * c);
}

__global__ void copy_const_kernel( float *iptr ) {
    int x = threadIdx.x + blockIdx.x * blockDim.x;
    int y = threadIdx.y + blockIdx.y * blockDim.y;
    int offset = x + y * blockDim.x * gridDim.x;

    float c = tex1Dfetch(texConstSrc,offset);
    if (c != 0)
    iptr[offset] = c;
}


struct DataBlock {
    unsigned char   *output_bitmap;
    float           *dev_inSrc;
    float           *dev_outSrc;
    float           *dev_constSrc;
    CPUAnimBitmap  *bitmap;

    cudaEvent_t     start, stop;
    float           totalTime;
    float           frames;
};

void anim_gpu( DataBlock *d, int ticks ) {
    HANDLE_ERROR(cudaEventRecord( d->start, 0 ));
    dim3    blocks(DIM/16,DIM/16);
    dim3    threads(16,16);
    CPUAnimBitmap  *bitmap = d->bitmap;

    volatile bool dstOut = true;
    for (int i=0; i<90; i++) {
        float   *in, *out;
        if (dstOut) {
        in  = d->dev_inSrc;
        out = d->dev_outSrc;
        }else{
        out = d->dev_inSrc;
        in  = d->dev_outSrc;
        }
        copy_const_kernel<<<blocks,threads>>>( in );
        blend_kernel<<<blocks,threads>>>( out, dstOut );
        dstOut = !dstOut;
    }
    float_to_color<<<blocks,threads>>>( d->output_bitmap,d->dev_inSrc );

    HANDLE_ERROR(cudaMemcpy( bitmap->get_ptr(), d->output_bitmap,bitmap->image_size(),cudaMemcpyDeviceToHost));
    HANDLE_ERROR(cudaEventRecord( d->stop, 0 ));
    HANDLE_ERROR(cudaEventSynchronize( d->stop ));
    float   elapsedTime;
    HANDLE_ERROR(cudaEventElapsedTime( &elapsedTime,d->start, d->stop ));
    d->totalTime += elapsedTime;
    ++d->frames;
    printf( "Average Time per frame:  %3.1f ms\n",d->totalTime/d->frames  );
}
void anim_exit( DataBlock *d ) {
    cudaUnbindTexture( texIn );
    cudaUnbindTexture( texOut );
    cudaUnbindTexture( texConstSrc );
    HANDLE_ERROR(cudaFree( d->dev_inSrc ));
    HANDLE_ERROR(cudaFree( d->dev_outSrc ));
    HANDLE_ERROR(cudaFree( d->dev_constSrc ));
    HANDLE_ERROR(cudaEventDestroy( d->start ));
    HANDLE_ERROR(cudaEventDestroy( d->stop ));
}
int main( void ) {
    DataBlock   data;
    CPUAnimBitmap bitmap( DIM, DIM, &data );
    data.bitmap = &bitmap;
    data.totalTime = 0;
    data.frames = 0;
    HANDLE_ERROR(cudaEventCreate( &data.start ));
    HANDLE_ERROR(cudaEventCreate( &data.stop ));
    int imageSize = bitmap.image_size();
    HANDLE_ERROR(cudaMalloc( (void**)&data.output_bitmap,imageSize ));
    HANDLE_ERROR(cudaMalloc( (void**)&data.dev_inSrc,imageSize ) );
    HANDLE_ERROR(cudaMalloc( (void**)&data.dev_outSrc,imageSize ));
    HANDLE_ERROR(cudaMalloc( (void**)&data.dev_constSrc,imageSize ));
    HANDLE_ERROR(cudaBindTexture( NULL, texConstSrc,data.dev_constSrc,imageSize ));
    HANDLE_ERROR(cudaBindTexture( NULL, texIn,data.dev_inSrc,imageSize ));
    HANDLE_ERROR(cudaBindTexture( NULL, texOut,data.dev_outSrc,imageSize ));
    float *temp = (float*)malloc( imageSize );
    for (int i=0; i<DIM*DIM; i++) {
        temp[i] = 0;
        int x = i % DIM;
        int y = i / DIM;
        if ((x>300) && (x<600) && (y>310) && (y<601))
        temp[i] = MAX_TEMP;
    }
    temp[DIM*100+100] = (MAX_TEMP + MIN_TEMP)/2;
    temp[DIM*700+100] = MIN_TEMP;
    temp[DIM*300+300] = MIN_TEMP;
    temp[DIM*200+700] = MIN_TEMP;
    for (int y=800; y<900; y++) {
        for (int x=400; x<500; x++) {
        temp[x+y*DIM] = MIN_TEMP;
        }
    }

    HANDLE_ERROR(cudaMemcpy( data.dev_constSrc, temp,imageSize,cudaMemcpyHostToDevice ));

    for (int y=800; y<DIM; y++) {
        for (int x=0; x<200; x++) {
        temp[x+y*DIM] = MAX_TEMP;
        }
    }
    HANDLE_ERROR(cudaMemcpy( data.dev_inSrc, temp,imageSize,cudaMemcpyHostToDevice ));
    free( temp );
    //anim_gpu(&data,0);
    bitmap.anim_and_exit((void(*)(void*,int))anim_gpu,(void(*)(void*))anim_exit);
}

报错的图片如下，怎么解决

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
陀思妥Ye夫斯基 2023-04-25 09:06
关注
远程服务器的话，无法显示热传导模型，所以把最后一句代码注释掉，用倒二行，就行了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

CUDA by example Chapter7 纹理内存
2019-09-02 17:06

Leo-Ma的博客纹理内存纹理内存简介热传导模拟简单的传热模型代码中温度更新的计算GPU不使用纹理内存的热传导模拟计算GPU使用一维纹理内存的热传导模拟计算GPU使用二维纹理内存的热传导模拟计算纹理内存简介和常量内存一样，...
基于纹理内存的CUDA热传导模拟
2014-09-24 16:27

weixin_30677475的博客纹理内存是只读内存，与常量内存相同的是，纹理内存也缓存在芯片中，因此某些情况下，它能减少对内存的请求并提供更高效的内存宽带。纹理内存专门为那些内存访问模式中存在大量空间局部性的图形应用程序而设计的。在...
使用二维纹理内存模拟热传导
2012-06-19 15:44

wufenxia的博客 #include #include "book.h" #include "cpu_anim.h" #define DIM 1024 #define PI 3.141592653f #define MAX_TEMP 1.0f ...#define MIN_TEMP 0.0001f .../*使用二维维纹理内存*/ //在GPU上定义纹理变量 text
使用用一维纹理存储器的热传导模拟
2012-06-19 15:28

wufenxia的博客 #include #include "book.h" #include "cpu_anim.h" #define DIM 1024 #define PI 3.141592653f #define MAX_TEMP 1.0f .../*在温度更新计算的内存访问模式中存在着巨大的内存空间局部性，这种访
CUDA中共享内存、常量内存和纹理内存的概念和应用（小白入门）
2020-03-09 20:56

o__O_pyx的博客刚接触CUDA，结合教材和资料整理了这篇共享内存、常量内存和纹理内存的基础内容，希望能帮到路过的你:P
CUDA（Ⅷ）：纹理内存（Texture Memory）
2019-04-27 21:07

在追梦的路上xxxxx的博客了解如何在CUDA C中使用一维纹理内存了解如何在CUDA C中使用二维纹理内存 2.背景提出：特定环境中使用特殊的内存将极大地提升应用程序的性能。与Constant Memory相似，Texture Memory同样缓存在芯片上，只读...
CUDA By Example(六)——纹理内存
2022-11-17 19:57

hhhcbw的博客 CUDA C中纹理内存使用的说明，并以热传导模拟为例
30、并行计算模型与图形处理单元算法实现解析
2025-07-23 06:53

Wind6的博客 GCA - w 模型作为一种扩展的全局元胞自动机模型，具有动态链接邻居和直接写访问能力，能够在O(1)时间内完成信息传输，提高了资源利用率和计算效率。文章详细分析了其模型特点、计算过程及硬件架构实现方式。同时，...
CUDA Samples: heat conduction(模拟热传导)
2017-07-28 09:44

fengbingchun的博客 CUDA Samples: heat conduction(模拟热传导)
CUDA By Examples 8 - 纹理内存Texture Memory
2017-06-28 18:56

Full_Speed_Turbo的博客可以使用一维和二维纹理内存. 纹理内存是只读的.
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月23日

CUDA使用1维纹理内存，进行热传导模型计算

3条回答 默认 最新

问题事件

3条回答默认最新