One_Salted_Fish 2019-04-12 09:27 采纳率: 0%
浏览 654

怎么在VS2013中使用CUB库

我想在CUDA程序中添加CUB库,请问要怎么做?

环境:Win10+VS2013+CUDA8.0

CUB库文档:http://nvlabs.github.io/cub/

文档中仅说明了使用nvcc编译时的方法,

例如nvcc -arch=sm_XX example_block_radix_sort.cu -I../.. -lcudart -O3

但是我想知道怎么在VS项目中加入CUB库

使用CUB库的例子程序:

#include <cub/cub.cuh>
#include <stdio.h>
#define nTPB 32
#define ELEMS_PER_THREAD 1

// Block-sorting CUDA kernel (nTPB threads each owning ELEMS_PER THREAD integers)
__global__ void BlockSortKernel()
{
    __shared__ int my_val[nTPB*ELEMS_PER_THREAD];
    using namespace cub;
    // Specialize BlockRadixSort collective types
    typedef BlockRadixSort<int, nTPB, ELEMS_PER_THREAD> my_block_sort;
    // Allocate shared memory for collectives
    __shared__ typename my_block_sort::TempStorage sort_temp_stg;

    // need to extend synthetic data for ELEMS_PER_THREAD > 1
    my_val[threadIdx.x*ELEMS_PER_THREAD]  = (threadIdx.x + 5)%nTPB; // synth data
    __syncthreads();
    printf("thread %d data = %d\n", threadIdx.x,  my_val[threadIdx.x*ELEMS_PER_THREAD]);

    // Collectively sort the keys
    my_block_sort(sort_temp_stg).Sort(*static_cast<int(*)[ELEMS_PER_THREAD]>(static_cast<void*>(my_val+(threadIdx.x*ELEMS_PER_THREAD))));
    __syncthreads();

    printf("thread %d sorted data = %d\n", threadIdx.x,  my_val[threadIdx.x*ELEMS_PER_THREAD]);
}

int main(){
    BlockSortKernel<<<1,nTPB>>>();
    cudaDeviceSynchronize();

}
  • 写回答

1条回答 默认 最新

  • 你知我知皆知 2024-08-08 21:12
    关注

    以下回答参考 皆我百晓生券券喵儿 等免费微信小程序相关内容作答,并由本人整理回复。

    要在Visual Studio 2013中使用CUB库,你需要按照以下步骤操作:

    1. 添加CUB库到你的工程中。你可以从NuGet仓库下载并安装CUB库,或者通过命令行工具安装。

    2. 在你的main.cpp文件中包含cub.hcub_cuda.h头文件,这两个文件包含了CUB的API接口。

    #include "cub.h"
    #include "cub_cuda.h"
    
    1. 在你的BlockSortKernel函数中,使用cub_cuda函数来调用CUB库。在这个例子中,我们正在对一组整数进行排序。你可以将这个函数替换为你想要使用的任何其他CUB函数。

    2. 编译你的程序。如果你使用的是Windows系统,你可能需要在命令行上运行nvcuda.exe(如果是Ubuntu/Linux系统的话,则可能是nvcc.exe)来编译你的CUDA代码。然后,在Visual Studio中打开你的解决方案,选择"Build" -> "Rebuild Solution"来重新构建你的项目。

    现在,你应该可以在你的CUDA程序中看到来自CUB库的输出了。请注意,这只是一个基本示例,实际的使用可能会有所不同。

    评论

报告相同问题?