目前需要用boost库多线程和CUFFT,GPU型号是NVIDIA GeForce GTX 960M,GPU占用率只有10%左右。CPU(4核8线程)中的多线程和GPU中的多线程并行执行有什么关系?设计核函数的时候线程格、线程块、线程数不同会有什么影响?如何优化才能提高GPU的占用率呢?960M的GPU有5个SM,每个SM有128个SP,每个线程块中的最大线程数是1024。使用流并行的话怎么设计流的数量呢?求各路大神指点迷津,先说声谢谢。另外对CUFFT有兴趣的也可以交流一下。
悬赏问题
- ¥15 cgictest.cgi文件无法访问
- ¥20 删除和修改功能无法调用
- ¥15 kafka topic 所有分副本数修改
- ¥15 小程序中fit格式等运动数据文件怎样实现可视化?(包含心率信息))
- ¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops?
- ¥40 串口调试助手打开串口后,keil5的代码就停止了
- ¥15 电脑最近经常蓝屏,求大家看看哪的问题
- ¥60 高价有偿求java辅导。工程量较大,价格你定,联系确定辅导后将采纳你的答案。希望能给出完整详细代码,并能解释回答我关于代码的疑问疑问,代码要求如下,联系我会发文档
- ¥50 C++五子棋AI程序编写
- ¥30 求安卓设备利用一个typeC接口,同时实现向pc一边投屏一边上传数据的解决方案。