Xiuhong_Li
2017-08-14 11:04CUDA编程中如何使用双精度FP64单元,计算单精度FP32指令
我的CUDA核函数中只使用了INT32和FP32的数据类型,可是在用NVprofiler拿到的profiling中:
却看到使用了FP64执行单元。
请问,这是什么原因呢?
另外,如何在kernel里面显式指定计算单元,比如指定使用FP64单元计算FP32指令?
- 点赞
- 回答
- 收藏
- 复制链接分享
1条回答
为你推荐
- MFC框架下自定义类中定义多线程问题
- c++
- 3个回答
- pytorch cuda版运行出错 invalid start byte
- python
- 神经网络
- 2个回答
- win10和ubuntu16.04双系统,CUDA只能在一个系统配置吗?
- 深度学习
- 机器学习
- 人工智能
- tensorflow
- 3个回答
- 求助:CUDA的RuntimeError:cuda runtime error (30)
- python
- 神经网络
- 6个回答
- 安装cuda8.0遇到找不到硬件的问题
- python
- 机器学习
- 1个回答
换一换