这个问题与使用的显卡有关,但可以暂时不考虑显卡的问题。希望举例说明
2条回答 默认 最新
- CSDN专家-深度学习进阶 2022-04-25 08:18关注
调用核函数的时候,可以有多个block,,每个block所能容纳的最大线程数也是有限的。其实在硬件上,每个block里面的所有thread会共用一个处理器核心,而且它们共享的shared memory也是有限的;所以从设计角度出发,CUDA限制了每个block最多只能有1024个线程。
当然可以使用多个block,跟thread的1到3维结构一样,block也可以按照1到3维组织起来,用blockIdx索引,这个block的集合被叫做“grid”,一个grid里面的block数量往往是根据实际数据需要决定的,经常会超出GPU实际拥有的处理器核心数量。
参考CUDA编程 (2.1)—— 核函数、线程层级 - 知乎 hello大家好,这篇文章我们正式开始学习CUDA编程的具体操作。CUDA的语言是一种类似C++的代码风格,结合下文将会介绍的编程模型,相信大家会对CUDA编程有个初步的感受,有个大方向。当然如果想要真正从入门到精通CU… https://zhuanlan.zhihu.com/p/398427344本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 使用百度地图api 位置函数报错?
- ¥15 metamask如何添加TRON自定义网络
- ¥66 关于川崎机器人调速问题
- ¥15 winFrom界面无法打开
- ¥30 crossover21 ARM64版本安装软件问题
- ¥15 mymetaobjecthandler没有进入
- ¥15 mmo能不能做客户端怪物
- ¥15 osm下载到arcgis出错
- ¥15 Dell g15 每次打开eiq portal后3分钟内自动退出
- ¥200 使用python编写程序,采用socket方式获取网页实时刷新的数据,能定时print()出来就行。