GEForce RTX3060 配置如下:
28个流处理器, 每个SM最多运行1536个TH read 那么一个kernel 最多为可以运行43008
此外 vs中测试的网格MAX数目(maxGridSize)在三个纬度下是(2147483647 65535 ~)为啥每个grid分配这么多的块 一个核函到底用threa d 的数量是几
在我的程序中 使用此显卡 并行处理27万个单元 最大了 即每个线程处理一个单元,为什么处理这么多 和最大的Thread数不一致 原因为何
大家见谅,表述可能不清楚,因为内容不让重复,有疑问欢迎留言!