八月的雨季997 2022-04-24 19:06 采纳率: 75%
浏览 96
已结题

cuda编程中,一个核函数可以最多运行多少个thread

GEForce RTX3060 配置如下:
28个流处理器, 每个SM最多运行1536个TH read 那么一个kernel 最多为可以运行43008

此外 vs中测试的网格MAX数目(maxGridSize)在三个纬度下是(2147483647 65535 ~)为啥每个grid分配这么多的块 一个核函到底用threa d 的数量是几

在我的程序中 使用此显卡 并行处理27万个单元 最大了 即每个线程处理一个单元,为什么处理这么多 和最大的Thread数不一致 原因为何

大家见谅,表述可能不清楚,因为内容不让重复,有疑问欢迎留言!

  • 写回答

2条回答 默认 最新

  • 歇歇 2022-04-25 21:35
    关注
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 5月4日
  • 已采纳回答 4月26日
  • 赞助了问题酬金5元 4月25日
  • 修改了问题 4月24日
  • 展开全部