我现在在用Fortran对一个随机方程进行模拟。需要计算大量的样本,每个样本之间互相独立,并且每个样本返回的值很简单,只有两个浮点值,但每个样本的计算量很大。我现在用omp对每个样本在CPU上建立一个样本进行计算。但感觉还是不够快。最近想把显卡用上。但研究了一下OpenCL和CUDA,现在只能在仅显卡上做。我有两颗E5,如果只用显卡感觉挺浪费。能不能让CPU和GPU同时计算不同的样本。曾经在论坛上搜到在OpenCL的上下文设置一下就成,但找了些资料没头绪。求大神指点一下。如果能把CUDA和OpenCL的实现方法分别说一下就更好了。谢谢。
4条回答
- threenewbee 2014-12-04 07:42关注
GPU比CPU快大约10倍,所以算上CPU其实也快不了许多。如果非要榨干那么一点CPU的性能,还有个偷懒的办法就是用模拟器把CPU模拟成GPU。
解决 无用评论 打赏 举报
悬赏问题
- ¥15 求差集那个函数有问题,有无佬可以解决
- ¥15 【提问】基于Invest的水源涵养
- ¥20 微信网友居然可以通过vx号找到我绑的手机号
- ¥15 寻一个支付宝扫码远程授权登录的软件助手app
- ¥15 解riccati方程组
- ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
- ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
- ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
- ¥50 树莓派安卓APK系统签名
- ¥65 汇编语言除法溢出问题