八月的雨季 最後的冰吻 2022-04-25 22:11 采纳率: 75%
浏览 54
已结题

在较大规模计算中,cuda核函数中执行配置的线程数量为20万,程序可以运行。若想要运行更多的线程数量,有哪些解决方案?

我的思考:
1.核函数的运算量较大,有创建的对象,占用空间很大,有些核函数有if条件语句,需要将核函数的计算量减少。因为一个线程块使用的共享存储器和计算器数量变小,就可以分配更多的线程块(当前程序中每个线程块包含128个线程)
2.更换更好的显卡,就会有更多的cuda core和寄存器等资源,可以计算更多的线程(目前使用的显卡为Geforce RTX3060),若需要更换,可以选择哪些显卡呢?

  • 写回答

1条回答

      报告相同问题?

      相关推荐 更多相似问题

      问题事件

      • 系统已结题 5月4日
      • 已采纳回答 4月26日
      • 修改了问题 4月25日
      • 修改了问题 4月25日
      • 展开全部

      悬赏问题

      • ¥20 大学计算机网络实验报告
      • ¥20 Oracle触发器,用户管理题目
      • ¥250 python的exchangelib 报错
      • ¥15 Oracle外部过程获取的句柄属性为空
      • ¥20 snmpv3相关提问
      • ¥20 boost电路升压频率和占空比选择
      • ¥15 找个人工智能的大佬咨询一些毕设问题
      • ¥15 需要教程:GD32F450I移植无系统lwip
      • ¥15 中文语料库检索构式 求助
      • ¥15 关于naver点击量信息