opencl异构平台可以加快计算速度,主要核心算法是放到了kernel中进行运算。
最近研究一个算法,该算法过程中使用了大量的矩阵运算,例如先初始化单位矩阵、零矩阵,过程中有逆矩阵、转置,矩阵相乘,相除等等。目前查到的资料,如blas都是只是针对一个步骤,而我的算法包含了很多个矩阵运算。目前一直没有找到合适解决方案。
请各位大神能给一个指导思路,或相关文章。这个问题困扰了我很久。感谢大家。
关于OpenCL异构计算中,如何在算法中使用多个矩阵运算公式?
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- bobhuang 2020-04-24 10:53关注
基于opencl的计算,有几个步骤开销比较大:
1.数据从CPU导入到GPU;
2.结果从GPU导出CPU;
3.kernel程序的编译;
4.kernel程序导入到GPU;关键是减少这些开销大的步骤,使得运算时间集中在真正的计算上。例如每次计算的中间结果,可以保留在GPU中,作为下次计算的输入,这样可以明显减少开销。
解决 1无用
悬赏问题
- ¥15 基于单片机的靶位控制系统
- ¥15 AT89C51控制8位八段数码管显示时钟。
- ¥15 真我手机蓝牙传输进度消息被关闭了,怎么打开?(关键词-消息通知)
- ¥15 下图接收小电路,谁知道原理
- ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
- ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
- ¥15 手机接入宽带网线,如何释放宽带全部速度
- ¥30 关于#r语言#的问题:如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
- ¥15 ETLCloud 处理json多层级问题
- ¥15 matlab中使用gurobi时报错