Xiuhong_Li
Xiuhong_Li
2017-08-14 11:04

CUDA编程中如何使用双精度FP64单元,计算单精度FP32指令

  • cuda
  • 编程
  • gpgpu

我的CUDA核函数中只使用了INT32和FP32的数据类型,可是在用NVprofiler拿到的profiling中:
图片说明
却看到使用了FP64执行单元。

请问,这是什么原因呢?
另外,如何在kernel里面显式指定计算单元,比如指定使用FP64单元计算FP32指令?

  • 点赞
  • 回答
  • 收藏
  • 复制链接分享

1条回答

为你推荐

换一换