这个问题与使用的显卡有关,但可以暂时不考虑显卡的问题。希望举例说明
2条回答 默认 最新
- CSDN专家-深度学习进阶 2022-04-25 08:18关注
调用核函数的时候,可以有多个block,,每个block所能容纳的最大线程数也是有限的。其实在硬件上,每个block里面的所有thread会共用一个处理器核心,而且它们共享的shared memory也是有限的;所以从设计角度出发,CUDA限制了每个block最多只能有1024个线程。
当然可以使用多个block,跟thread的1到3维结构一样,block也可以按照1到3维组织起来,用blockIdx索引,这个block的集合被叫做“grid”,一个grid里面的block数量往往是根据实际数据需要决定的,经常会超出GPU实际拥有的处理器核心数量。
参考CUDA编程 (2.1)—— 核函数、线程层级 - 知乎 hello大家好,这篇文章我们正式开始学习CUDA编程的具体操作。CUDA的语言是一种类似C++的代码风格,结合下文将会介绍的编程模型,相信大家会对CUDA编程有个初步的感受,有个大方向。当然如果想要真正从入门到精通CU…https://zhuanlan.zhihu.com/p/398427344
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥60 PCDN如何使用宽带的电视业务通道拨号叠加带宽?
- ¥15 遇到这种校园宽带网络应该怎么样解决?
- ¥30 AXI VIP验证多余打印问题
- ¥15 利用加权最小二乘法求某品牌手机价格指标,已按照总销量计算出权重,各类型号手机价格已知,如何求得价格指标?
- ¥15 如何自制一个硬件钱包,有兴趣的朋友一起交流
- ¥15 (关键词-聊天软件)
- ¥15 求大家看看这个编程的编法没有思路啊
- ¥20 WSL打开图形化程序子窗口无法点击
- ¥15 Jupyter Notebook 数学公式不渲染
- ¥20 ERR_CACHE_MISS 确认重新提交表单