Xiuhong_Li 2017-08-14 11:04 采纳率: 0%
浏览 1686

CUDA编程中如何使用双精度FP64单元,计算单精度FP32指令

我的CUDA核函数中只使用了INT32和FP32的数据类型,可是在用NVprofiler拿到的profiling中:
图片说明
却看到使用了FP64执行单元。

请问,这是什么原因呢?
另外,如何在kernel里面显式指定计算单元,比如指定使用FP64单元计算FP32指令?

  • 写回答

1条回答 默认 最新

  • dabocaiqq 2018-06-10 15:49
    关注
    评论

报告相同问题?

悬赏问题

  • ¥15 yolov7训练自己的数据集
  • ¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)(相关搜索:51单片机|单片机|测试代码)
  • ¥15 电力市场出清matlab yalmip kkt 双层优化问题
  • ¥30 ros小车路径规划实现不了,如何解决?(操作系统-ubuntu)
  • ¥20 matlab yalmip kkt 双层优化问题
  • ¥15 如何在3D高斯飞溅的渲染的场景中获得一个可控的旋转物体
  • ¥88 实在没有想法,需要个思路
  • ¥15 MATLAB报错输入参数太多
  • ¥15 python中合并修改日期相同的CSV文件并按照修改日期的名字命名文件
  • ¥15 有赏,i卡绘世画不出