这个问题与使用的显卡有关,但可以暂时不考虑显卡的问题。希望举例说明
2条回答 默认 最新
- CSDN专家-深度学习进阶 2022-04-25 08:18关注
调用核函数的时候,可以有多个block,,每个block所能容纳的最大线程数也是有限的。其实在硬件上,每个block里面的所有thread会共用一个处理器核心,而且它们共享的shared memory也是有限的;所以从设计角度出发,CUDA限制了每个block最多只能有1024个线程。
当然可以使用多个block,跟thread的1到3维结构一样,block也可以按照1到3维组织起来,用blockIdx索引,这个block的集合被叫做“grid”,一个grid里面的block数量往往是根据实际数据需要决定的,经常会超出GPU实际拥有的处理器核心数量。
参考CUDA编程 (2.1)—— 核函数、线程层级 - 知乎 hello大家好,这篇文章我们正式开始学习CUDA编程的具体操作。CUDA的语言是一种类似C++的代码风格,结合下文将会介绍的编程模型,相信大家会对CUDA编程有个初步的感受,有个大方向。当然如果想要真正从入门到精通CU… https://zhuanlan.zhihu.com/p/398427344本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
- ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
- ¥20 有关区间dp的问题求解
- ¥15 多电路系统共用电源的串扰问题
- ¥15 slam rangenet++配置
- ¥15 有没有研究水声通信方面的帮我改俩matlab代码
- ¥15 ubuntu子系统密码忘记
- ¥15 保护模式-系统加载-段寄存器
- ¥15 电脑桌面设定一个区域禁止鼠标操作
- ¥15 求NPF226060磁芯的详细资料