我的CUDA核函数中只使用了INT32和FP32的数据类型,可是在用NVprofiler拿到的profiling中:
却看到使用了FP64执行单元。
请问,这是什么原因呢?
另外,如何在kernel里面显式指定计算单元,比如指定使用FP64单元计算FP32指令?
我的CUDA核函数中只使用了INT32和FP32的数据类型,可是在用NVprofiler拿到的profiling中:
却看到使用了FP64执行单元。
请问,这是什么原因呢?
另外,如何在kernel里面显式指定计算单元,比如指定使用FP64单元计算FP32指令?