m0_38144132
2017-08-31 02:16请问fbcunn中的FBFFT算法相较CUFFT所优化的地方?
看官方的文献说明是FBFFT的基础就是用的CUFFT但是较之好像有改进的地方,我没有找到相关的文献说明。还有就是FBMM矩阵运算相比较于CUBLAS transpose+CUBLAS GEMM又有改进的地方。有大神知道这些改进在哪吗?我读源码还没有读出来。。。。求大神点醒。
- 点赞
- 回答
- 收藏
- 复制链接分享
看官方的文献说明是FBFFT的基础就是用的CUFFT但是较之好像有改进的地方,我没有找到相关的文献说明。还有就是FBMM矩阵运算相比较于CUBLAS transpose+CUBLAS GEMM又有改进的地方。有大神知道这些改进在哪吗?我读源码还没有读出来。。。。求大神点醒。