刚学cusparse库，做spmv乘法时代码没报错没有得到自己想要的结果

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <cuda_runtime.h>
#include <cusparse.h>

// error check macros
#define CUSPARSE_CHECK(x) {cusparseStatus_t _c=x; if (_c != CUSPARSE_STATUS_SUCCESS) {printf("cusparse fail: %d, line: %d\n", (int)_c, LINE); exit(-1);}}

#define cudaCheckErrors(msg)
do {
cudaError_t __err = cudaGetLastError();
if (__err != cudaSuccess) {
fprintf(stderr, "Fatal error: %s (%s at %s:%d)\n",
msg, cudaGetErrorString(__err),
FILE, LINE);
fprintf(stderr, "*** FAILED - ABORTING\n");
exit(1);
}
} while (0)

int main()
{
const int n = 3;
const int nnzA = 5;
const double h_valA[nnzA] = { 3.0, 2.0, 2.0, 2.0, 1.0 };
const int h_csrColIndA[nnzA] = { 0, 2, 1, 0, 2 };
const int h_csrRowPtrA[n+1] = { 0, 2, 3, 5 };
const double h_b[n] = { 3.5, 1.5, 2.0 };
int y[n] = { 0.0, 0.0, 0.0 };

//CSR format of matrix A and Vector b (device)
double* valA;
int* csrRowPtrA;
int* csrColIndA;
double* b;
double* Y;

cudaMalloc((void**)&valA, nnzA * sizeof(double));
cudaMalloc((void**)&csrRowPtrA, (n + 1) * sizeof(int));
cudaMalloc((void**)&csrColIndA, nnzA * sizeof(int));
cudaMalloc((void**)&b, n * sizeof(double));
cudaMalloc((void**)&Y, n * sizeof(double));
cudaCheckErrors("cudaMalloc fail");

cudaMemcpy(valA, h_valA, (size_t)(nnzA * sizeof(double)), cudaMemcpyHostToDevice);
cudaMemcpy(csrRowPtrA, h_csrRowPtrA, (size_t)((n + 1) * sizeof(int)), cudaMemcpyHostToDevice);
cudaMemcpy(csrColIndA, h_csrColIndA, (size_t)(nnzA * sizeof(int)), cudaMemcpyHostToDevice);
cudaMemcpy(b, h_b, (size_t)(n * sizeof(double)), cudaMemcpyHostToDevice);
cudaMemcpy(Y, y, (size_t)(n * sizeof(double)), cudaMemcpyHostToDevice);
cudaCheckErrors("cudaMemcpy fail");

float      alpha = 1.0f;
float      beta = 0.0f;

cusparseHandle_t handle = NULL;
cusparseSpMatDescr_t matA;
cusparseDnVecDescr_t vecX, vecY;
void* dBuffer = NULL;
size_t               bufferSize = 0;
CUSPARSE_CHECK(cusparseCreate(&handle));
CUSPARSE_CHECK(cusparseCreateCsr(&matA, n, n, nnzA, csrRowPtrA, csrColIndA, valA,
    CUSPARSE_INDEX_32I, CUSPARSE_INDEX_32I, CUSPARSE_INDEX_BASE_ZERO, CUDA_R_32F));

CUSPARSE_CHECK(cusparseCreateDnVec(&vecX, n, b, CUDA_R_32F));

CUSPARSE_CHECK(cusparseCreateDnVec(&vecY, n, Y, CUDA_R_32F));

CUSPARSE_CHECK(cusparseSpMV_bufferSize(handle, CUSPARSE_OPERATION_NON_TRANSPOSE, &alpha, matA, vecX, &beta, vecY, CUDA_R_32F, CUSPARSE_MV_ALG_DEFAULT, &bufferSize));

cudaMalloc(&dBuffer, bufferSize);
cudaCheckErrors("cudaMalloc fail");
CUSPARSE_CHECK(cusparseSpMV(handle, CUSPARSE_OPERATION_NON_TRANSPOSE, &alpha, matA, vecX, &beta, vecY, CUDA_R_32F, CUSPARSE_MV_ALG_DEFAULT, dBuffer));


CUSPARSE_CHECK(cusparseDestroySpMat(matA));
CUSPARSE_CHECK(cusparseDestroyDnVec(vecX));
CUSPARSE_CHECK(cusparseDestroyDnVec(vecY));
CUSPARSE_CHECK(cusparseDestroy(handle));

cudaMemcpy(y, Y, n * sizeof(double), cudaMemcpyDeviceToHost);
cudaCheckErrors("cudaMemcpy fail");
for (int i = 0; i < n; i++)
{
    printf("x[%i] = %f\n", i, y[i]);
}
cudaFree(dBuffer);
cudaFree(csrRowPtrA);
cudaFree(csrColIndA);
cudaFree(valA);
cudaFree(Y);
cudaFree(b);

return 0;

}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
unipx2008 2022-11-07 09:26
关注
CUDA_R_32F数据类型与double不匹配

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

刚学cusparse库，做spmv乘法时代码没报错没有得到自己想要的结果 c++ c语言
2021-07-07 20:20

回答 2 已采纳 CUDA_R_32F数据类型与double不匹配
LightSpMV:基于GPU的轻量级稀疏矩阵矢量乘法（SpMV）-开源
2021-04-29 08:00

LightSpMV是一种使用标准压缩稀疏行（CSR）存储格式的新颖CUDA兼容稀疏矩阵矢量乘法（SpMv）算法。我们已经使用各种稀疏矩阵评估了LightSpMV，并将其与最新的CUSP和cuSPARSE中基于CSR的SpMV子程序进行了比较。性能...
SpMV_CSR:使用压缩稀疏行格式的稀疏矩阵向量乘法
2021-03-10 11:36

SpMV_CSR 使用压缩稀疏行格式的稀疏矩阵矢量乘法来编译代码，请使用gcc CSR.c mmio.c -o csr ./csr [filename.mtx]
SPMV基础-1
2023-07-11 18:35

库达ZT的博客所以需要一种手段，引入尽可能少的索引结构，构建从值到行号列号的反查手段，可以让一个线程知道自己是不是算到了行的边界，以及自己具体在算哪一行，并且要如何解决多个层次的同步问题和线程临时结果的规约问题。...
spmv：稀疏矩阵向量（SpMV）工作台
2021-02-20 05:39

稀疏矩阵向量（SpMV）工作台。 x是一个密集数组 y是一个密集数组 A是一个稀疏矩阵。 y = Ax ./spmva-M x024 - 1024 -r 0.05 M 1024, K 1024, rho 0.050, T gemm 0.026158, MFLOP/s 76.46, T spmv 0.000018 + 0....
cuSPARSE库：（六）cusparseMatrixType_t的说明
2020-05-18 12:40

Coder802的博客 cusparseMatrixType_t：此类型指示存储在稀疏存储中的矩阵的类型。...矩阵类型（MatrixType）和填充模式的基本思想是保持对称/厄米矩阵的最小存储量，并利用SpMV(Sparse Matrix Vector multiplication)的对称性 ...
spmv的MPI和MPI+CUDA并行实现
2021-12-02 17:02

spmv的串行和cpu、gpu并行性能测试demo
cudaSpmv:CUDA稀疏矩阵向量乘法，使用切片坐标格式
2021-05-14 16:40

cudaSpmv 使用切片坐标格式的CUDA稀疏矩阵矢量乘法（以及其他处于尖峰的格式） prep ：对输入矩阵进行分区，将分区后的矩阵存储在二进制文件中，以加快访问速度spmv ：使用prep好的文件执行spmv cusp ：使用cusp库...
GPU上基于稀疏矩阵-矢量乘法统计的性能预测
2020-06-05 15:03

作为线性代数中最重要和最重要的运算之一，近年来，稀疏矩阵矢量乘法（SpMV）在GPU上的性能预测越来越受到关注。在2012年，Guo和Wang提出了一个新的想法来预测SpMV在GPU上的性能。但是，他们没有完全考虑矩阵的...
GPU加速的大数据在内存集群计算中的迭代稀疏矩阵-向量乘法
2021-03-02 04:49

迭代SpMV（ISpMV）是许多基于图的数据挖掘算法和机器学习算法中的关键操作。随着大数据的发展，矩阵是如此之大，也许是十亿规模，以至于SpMV无法在一台计算机上实现。因此，为大型数据集实现和优化SpMV是一个具有...
【调研】GPU矩阵乘法的性能预测——Machine Learning Approach for Predicting The Performance of SpMV on GPU
2022-10-15 16:22

小锋学长生活大爆炸的博客 GPU上SpMV性能预测的机器学习方法
Performance Analysis and Optimization for SpMV on GPU
2018-04-07 17:46

Generally, a parallel application consists of precedence constrained stochastic tasks, where task processing times and intertask communication times are random variables following certain probability ...
Benchmark_SpMV_using_CSR:异构处理器（Intel Broadwell、AMD Kaveri 和 nVidia Tegra K1）上基于 CSR 的 SpMV
2021-06-06 18:36

使用 CSR 格式的异构处理器上的 SpMV 介绍这是论文的源代码 Weifeng Liu 和 Brian Vinter，“异构处理器上稀疏矩阵向量乘法的推测分段和”。并行计算，2015 年。（2015 年 4 月接受）[ ] 联系人：和 Brian ...
B-SCT：改进SIMD架构上的SpMV处理
2021-03-06 22:35

B-SCT：改进SIMD架构上的SpMV处理
论文研究 - PELLR：用于GPU上SpMV的置换ELLPACK-R格式
2020-05-14 06:17

稀疏矩阵矢量乘法（SpMV）在几乎所有科学计算中都是不可避免的，例如用于求解线性系统和特征值问题的迭代方法。随着图形处理单元（GPU）的出现和发展，应该为SpMV构建高效的格式。 SpMV的性能主要由稀疏矩阵的存储...
【算法学习】稀疏矩阵乘法 SpMV 压缩方法 CSR/CRS
2021-06-18 11:24

小张的学习手册的博客矩阵乘法简单，但是这个压缩方法，大家的博客对我来说有点难以理解，先留个坑，稍后补全 https://www.pianshen.com/article/86351046178/ https://www.cnblogs.com/YangZnufe/p/8413374.html
spmvaccsim:用于探索 SpMV 硬件加速器设计空间的 SystemC + DRAMSim2 模拟器
2021-07-14 20:53

用于探索 SpMV 硬件加速器设计空间的 Qt + SystemC + DRAMSim2 模拟器。重点是探索不同的微架构参数和 DRAM 数据布局如何影响可持续的 DRAM 带宽（进而影响性能，因为 SpMV 非常受内存限制）。
SpMV在CPU–GPU异构计算系统上的混合计算方法
2021-03-08 21:49

SpMV在CPU–GPU异构计算系统上的混合计算方法
在GPU上使用块格式和SpMV最佳分区的并行计算方法
2021-03-08 21:47

在GPU上使用块格式和SpMV最佳分区的并行计算方法
CUDA11 cusparse使用
2023-05-04 22:23

weixin_49830558的博客 cusparseCreateCsr(&matA, A_num_rows, A_num_cols, A_num_nnz, dA_csrOffsets, dA_columns, dA_values, CUSPARSE_INDEX_32I, CUSPARSE_INDEX_32I, CUSPARSE_INDEX_BASE_ZERO, CUDA_R_32F); 关于上面的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月26日

悬赏问题

¥15 目详情-五一模拟赛详情页
¥15 有了解d3和topogram.js库的吗？有偿请教
¥100 任意维数的K均值聚类
¥15 stamps做sbas-insar，时序沉降图怎么画
¥15 买了个传感器，根据商家发的代码和步骤使用但是代码报错了不会改，有没有人可以看看
¥15 关于#Java#的问题，如何解决？
¥15 加热介质是液体，换热器壳侧导热系数和总的导热系数怎么算
¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
¥15 cmd cl 0x000007b
¥20 BAPI_PR_CHANGE how to add account assignment information for service line

刚学cusparse库，做spmv乘法时代码没报错没有得到自己想要的结果

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新