2 m0 38144132 m0_38144132 于 2017.08.31 10:16 提问

请问fbcunn中的FBFFT算法相较CUFFT所优化的地方?

看官方的文献说明是FBFFT的基础就是用的CUFFT但是较之好像有改进的地方,我没有找到相关的文献说明。还有就是FBMM矩阵运算相比较于CUBLAS transpose+CUBLAS GEMM又有改进的地方。有大神知道这些改进在哪吗?我读源码还没有读出来。。。。求大神点醒。

1个回答

huang931027
huang931027   2017.08.31 10:29

感觉很厉害的样子。。。。。。。。

Csdn user default icon
上传中...
上传图片
插入图片