CUDA矩阵加法块、线程与数组间的理解

图片说明
global void MatAdd(float A[N][N], float B[N][N], float C[N][N]) {

int i = blockIdx.x * blockDim.x + threadIdx.x;

int j = blockIdx.y * blockDim.y + threadIdx.y;

if (i < N && j < N)

C[i][j] = A[i][j] + B[i][j];

}

图中blockDim.x=4,blockDim.y=3
代码中用block(1,1)和thread(1,1)求出的i=5,j=4代表什么意思？刚学这块，不是很懂

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2017-03-04 15:10
关注
http://blog.csdn.net/qq_25819827/article/details/51956774

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【CUDA】 矩阵加法 Matrix Addition
2024-06-21 11:25

WHAT816的博客 矩阵加法是逐元素进行的，天然适合CUDA并行计算。每个warp以SIMD方式调度线程。这意味着一个warp中的所有线程同时执行相同的指令。为了利用这一特性，同一warp中的线程应访问相邻的内存位置。这就是所谓的合并内存...
【CUDA代码实践02】矩阵加法运算程序
2024-10-25 10:01

BQ-Code的博客：初始化一个浮点数数组（向量），每个元素是一个随机生成的值，用于测试向量加法。：在 GPU 上并行执行向量加法。从设备端复制回主机端，以便在主机上进行打印。向量也被传输到设备中，以存储计算结果。向量复制到 ...
实数及复数矩阵加法并行CUDA
2014-08-28 00:54

【实数及复数矩阵加法并行CUDA】在计算机科学和工程领域，尤其是在高性能计算和图形处理中，CUDA（Compute Unified Device Architecture）是NVIDIA公司推出的一种编程模型，它允许程序员利用GPU（Graphics ...
CUDA实现矩阵加法
2019-05-11 20:53

全幼儿园最阔爱的博客本文通过一个矩阵加法的例子来说明如何使用网格和块来组织线程。使用块和线程建立矩阵索引通常情况下，一个矩阵用行优先的方法在全局内存中进行线性存储。如下图所示，这是一个8*6的矩阵。在一个矩阵加法和核...
使用cuda实现矩阵加法, my write
2025-04-28 19:28

小硕算法工程师的博客编译与运行使用nvcc进行编译 # 命令行终端执行 nvcc my_gpu_add.cu -o my_gpu_add 生成可执行文件my_gpu_add 运行 # 参数为执行加法运算的次数，相当于数组的大小 ./my_gpu_add 1 8.源代码附上源代码 // my_gpu_...
CUDA基础（二）组织并行线程，建立块和线程与矩阵索引的映射。
2023-03-20 20:31

Codiplay的博客鉴于 GPU 的硬件特性，线程块中的线程数最好配置为 32 的倍数。但是在实际工作中，很可能会出现这样的情况，我们手动配置参数所创建的线程数无法匹配为实现并行循环所需的线程数，比如实际上需要执行1230次循环，...
cuda编程入门:使用cuda实现矩阵加法
2022-06-08 13:51

Zannnne的博客 2.头文件关于cuda操作的一些接口都在这个头文件里 3.申请内存 cudaMalloc()接口 4.转移拷贝 cudaMemcpy()接口 ...7.编译与运行使用nvcc进行编译生成可执行文件运行 8.源代码附上源代码.........
cuda编程入门-CUDA运行实例（矩阵加法为例）
2025-01-18 20:54

我不会打代码啊啊的博客这个框架展示了CUDA程序的基本流程，包括核函数的定义、主机与设备内存的管理、数据传输以及核函数的调用等关键步骤。在实际编写CUDA程序时，需要根据具体的计算任务和数据结构，对这个框架进行扩展和优化，例如处理...
《cuda c编程权威指南》05 - cuda矩阵求和
2023-08-01 22:00

Mr.Q的博客 cuda矩阵求和
CUDA实现加法
2024-10-27 16:59

不知名Molen的博客函数，仅需要设定一个线程约束（有效的线程，数组长度为N，线程索引小于N的为有效），使用全局的线程索引，此时SM中的线程束执行有效的线程，即可实现数组求和。实现矩阵C=A+B，矩阵设为ny行nx列，nx=ny=32，定义一...
没有解决我的问题, 去提问

CUDA矩阵加法块、线程与数组间的理解

1条回答 默认 最新

1条回答默认最新