hipMemcpy出错： hipErrorInvalidValue

Error ：hip2.cpp:36 , code : 1011 , reason : hipErrorInvalidValue

#include <hip/hip_runtime.h>
#include <stdio.h>
#include <stdlib.h>
#include <iostream>
#define HIP_CHECK(command){\
    hipError_t status = command;\
    if(status != hipSuccess){\
        printf("Error ：%s:%d , ", __FILE__,__LINE__);   \
printf("code : %d , reason : %s \n", status,hipGetErrorString(status));exit(-1);}}

//kernel代码
__global__ void square(int* d_out, int* d_in) {
    int idx = threadIdx.x;
    //首先从全局内存读取对应此线程索引的数组元素,储存到浮点型变量f
    int f = d_in[idx];
    d_out[idx] = f * f;
}

int main(int argc, char** argv) {
    const int ARRAY_SIZE = 64;
    size_t ARRAY_BYTES = ARRAY_SIZE * sizeof(int);

    //h:cpu  d:gpu
    int h_in[ARRAY_SIZE];
    for (int i = 0; i < ARRAY_SIZE; i++)
    {
        h_in[i] = int(i); //类型转换
    }
    int h_out[ARRAY_SIZE];

    //在GPU声明指针
    int *d_in;
    int *d_out;

    //cudaMalloc:分配GPU的数据
    HIP_CHECK(hipMalloc(&d_in, ARRAY_BYTES));
    HIP_CHECK(hipMalloc(&d_out, ARRAY_BYTES));

    //从CPU拷贝到GPU
    //目标地址，原地址，字节数，转移方向
    //转移方向有三个
    HIP_CHECK(hipMemcpy(d_in, h_in, ARRAY_BYTES, hipMemcpyHostToDevice));

    //启动运算符
    dim3 dimGrid(64);
    dim3 dimBlock(1);
    hipLaunchKernelGGL(square, dimGrid, dimBlock, 0, 0 , d_out, d_in);

    ///将结果数组从d_out复制回h_out(cpu里)
    HIP_CHECK(hipMemcpy(h_out, d_out, ARRAY_BYTES, hipMemcpyDeviceToHost));

    //打印出h_out数据
    for (int i = 0; i < ARRAY_SIZE; i++) {
        printf("%d", h_out[i]);
        //每行打印4个，4个以后开始新行
        printf(((i % 4) != 3) ? "\t" : "\n");
    }

    //释放GPU内存
    HIP_CHECK(hipFree(d_in));
    HIP_CHECK(hipFree(d_out));
    d_in = NULL;
    d_out = NULL;

    return 0;

}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

国产加速器海光DCU&GPGPU深算处理器异构编程实战（下）
2024-08-26 06:30

技术瘾君子1573的博客 Fortran语言自20世纪50年代诞生至今...同C/C++语言一样，Fortran语言也是科学/工程计算领域的主流编程语言，使用Fortran语言编写的应用程序运行在世界各地大大小小的计算集群上，为人类的各种研究与创新提供数据支撑。
万字学习——DCU编程实战
2024-07-10 09:02

冰淇淋烤布蕾的博客 (hpccube.com) DCU软件栈 DCU的软件栈—DCU Toolkit（DTK） HIP（Heterogeneous-Compute Interface for Portability）是AMD公司在2016年提出的符合CUDA编程模型的、自由的、开源的C++编程接口和核函数语言。...
国产加速器海光DCU&GPGPU深算处理器异构编程实战（中）
2024-08-26 00:00

技术瘾君子1573的博客在C/C++中使用HIP编程接口编写程序是最主要的DCU程序开发方式，本章将从最简单的并行编程出发，逐步介绍如何开发高效的DCU程序。
万字学习——DCU编程实战补充
2024-07-10 09:14

冰淇淋烤布蕾的博客参考资料 2.1 详解DCU架构 · DCU 开发与使用文档 (hpccube....同上拷贝有两个方向 hipFree 释放DCU端的内存 HIP核函数 HIP全局内存管理与数据传输 HIP开发执行 HIP设备管理单进程多CPU编程 HIP性能分析 DCU程序优化
Tensor Core的WMMA API编程入门
2023-10-13 12:30

遂古之初，谁传道之的博客 } } hipMemcpy(a_gpu, a, (16*16) * sizeof(__half), hipMemcpyHostToDevice); hipMemcpy(b_gpu, b, (16*16) * sizeof(__half), hipMemcpyHostToDevice); hipMemcpy(c_gpu, c, (16*16) * sizeof(__half), ...
HIP编程
2020-07-19 09:03

kissgoodbye2012的博客国内互联网博客中，讲CUDA的很多，但讲AMD显卡的HIP编程语言的极少，刚好前段时间使用过国内超算平台，这个系列就来讲讲HIP语言。 1. 什么是HIP语言及相关有用查询网址； 2.怎么将CUDA转换为HIP语言； 3.共享内存...
GPU/DCU减少cudaMemcpy/hipMemcpy时间方案
2021-04-02 10:24

YoYo鹿鸣_HPC的博客提示：文章写完后，目录可以自动生成，如何生成可参考右边的...CUDA是GPU加速器上的编程语言，HIP是DCU加速器上的编程语言，二者生态相似，CUDA可通过hipify工具转换为HIP HIP docs: https://rocmdocs.amd.com/en/late
HIP编程笔记(一)
2020-06-22 12:26

weixin_42492403的博客 Memory management (hipMalloc(), hipMemcpy(), hipFree()) Streams (hipStreamCreate(),hipStreamSynchronize(), hipStreamWaitEvent()) Events (hipEventRecord(), hipEventElapsedTime(.
HIP编程学习之API例程
2021-08-02 20:00

Cherish511842885的博客 HIP API包括hipMalloc、hipMemcpy和hipFree等函数。熟悉CUDA的程序员也能够快速学习并开始使用HIP API编写代码。通过hipLaunchKernel的宏调用启动计算内核。下面给出了一个最简单的HIP编程的例子。其实有更多...
运行rocBLAS Example Code
2024-06-30 00:10

109702008的博客 //generate a integer number between [1, 10] } // copy array from host memory to device memory hipMemcpy(dx, hx.data(), sizeof(float) * n, hipMemcpyHostToDevice); // call rocBLAS function rocblas_...
一个 hipsolver 特征值示例
2024-03-28 00:43

Eloudy的博客 HIP_CHECK(hipMemcpy(d_A, A.data(), sizeof(double) * A.size(), hipMemcpyHostToDevice)); // 6. Initialize hipsolver hipsolverHandle_t hipsolver_handle; HIPSOLVER_CHECK(hipsolverCreate(&hipsolver_handle...
memmove函数和memcpy函数的介绍+差别（不透彻你打我
2022-09-13 22:40

T7ooo3o的博客看不懂你揍我！！！
HIP编程 —— 计算一维和二维矩阵相乘（GPU并行计算）
2022-03-28 19:58

Charles Ray的博客 //将A_h拷贝到device上的A_d CHECK ( hipMemcpy(A_d, A_h, Nbytes, hipMemcpyHostToDevice)); const unsigned blocks = 1; const unsigned threadsPerBlock = 700; //最大线程数不能超过1024 //开启GPU计算，将值...
cpp-HIP将CUDA转换为可移植C代码
2019-08-15 12:32

CUDA是一种由NVIDIA推出的编程接口，主要用于高效地利用GPU进行并行计算。然而，CUDA代码仅能在配备NVIDIA GPU的系统上运行，这限制了代码的可移植性。HIP（Heterogeneous Interface for Portability）是AMD推出的一...
在 HIP cuda kernel重塞进一句汇编语言，运行成功，纪念一下；没找到资料介绍方法
2023-05-23 20:52

Eloudy的博客 HIP_ASSERT(hipMemcpy(deviceC, hostC, NUM*sizeof(float), hipMemcpyHostToDevice)); hipLaunchKernelGGL(vectoradd_float, dim3(WIDTH/THREADS_PER_BLOCK_X, HEIGHT/THREADS_PER_BLOCK_Y), dim3(THREADS_PER_...
Rocm-Programming with HIP 内存分配
2024-08-26 20:37

青禾子的夏的博客传统调度模型：在传统的 GPU 编程模型中，CPU（作为生产者）将命令放入一个队列中，然后 GPU（作为消费者）从这个队列中取出命令并执行。这种模型通常涉及到在 CPU 端创建额外的线程来管理命令队列，这些线程负责...
HIP的应用可移植性
2024-06-08 16:32

109702008的博客将CUDA应用程序转换为HIP 手动将大型且复杂的现有CUDA代码项目转换为HIP是一个容易出错且耗时的过程。鉴于HIP和CUDA之间的语法相似性，可以构建自动化转换工具来将CUDA代码转换为可移植的HIP C++。AMD ROCm™堆栈...
hipBLAS示例程序
2024-07-26 00:17

109702008的博客 // 将数据从主机复制到设备 CHECK_HIP_ERROR(hipMemcpy(dA, hA, lda * N * sizeof(float), hipMemcpyHostToDevice)); CHECK_HIP_ERROR(hipMemcpy(dx, hx, N * sizeof(float), hipMemcpyHostToDevice)); CHECK_HIP_...
roctracer 的应用示例
2024-09-14 13:46

Eloudy的博客 // Memory transfer from host to device HIP_CALL(hipMemcpy(gpuMatrix, Matrix, NUM * sizeof(float), hipMemcpyHostToDevice)); // Lauching kernel from host hipLaunchKernelGGL( matrixTranspose, dim3(WIDTH...
AMD Instinct™ MI200 GPU内存空间概述
2024-09-30 21:26

109702008的博客更多关于固定内存分配标志的信息可以参见HIP编程指南。使用上述标志通过`hipHostMalloc`调用可以控制分配一致和非一致内存： template T * allocateHost_PinnedCoherent(const size_t size) { void * ptr; HIP_CHECK...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月18日

悬赏问题

¥15 电视版的优酷可以设置电影连续播放吗？
¥50 复现论文；matlab代码编写
¥30 echarts 3d地图怎么实现一进来页面散点数据和卡片一起轮播
¥15 数字图像的降噪滤波增强
¥15 心碎了，为啥我的神经网络训练的时候第二个批次反向传播会报错呀，第一个批次都没有问题
¥15 MSR2680-XS路由器频繁卡顿问题
¥15 VB6可以成功读取的文件，用C#读不了
¥15 如何使用micpyhon解析Modbus RTU返回指定站号的湿度值，并确保正确？
¥15 C++ 句柄后台鼠标拖动如何实现
¥15 有人会SIRIUS 5.8.0这个软件吗

hipMemcpy出错： hipErrorInvalidValue

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新