Sakura o 2021-08-03 17:58 采纳率: 100%
浏览 68
已结题

openmp对for循环的优化反而导致运算时间变长,是怎么回事呢


#include<iostream>
#include"omp.h"
#define numbs 10000
using namespace std;
int main()
{
    int i,j,a[numbs]={0},k=1,b[numbs];
    double start, finish;
omp_set_num_threads(16);
omp_set_dynamic(0);
#pragma omp parallel for private(i) shared(a,b)
for (i = 0; i < numbs; i++)
        {
            b[i] = i;
        }
start = omp_get_wtime();

#pragma omp parallel for  shared(a) private(i,j) collapse(2) 
    for (j = 1; j < numbs; j++)
    {
        for (i = j; i >= 0; i--)
        {
            a[j] += k * b[i];
            k = -k;
        }
        k = 1;
    }
finish = omp_get_wtime();
for (i = 0; i < 10; i++)
        {
            cout << a[i] << endl;

        }
    
    cout << finish-start<<endl ;
}

表示不明白原因

  • 写回答

1条回答 默认 最新

  • 地球屋里老师 2021-08-05 11:23
    关注

    1、对人来说 10000 比较大了,但对现在的cpu来说,计算量太小,omp的开销比任务本身还大。
    2、把任务量换到10亿,同时计算中加入一些三角函数,再看看结果
    3、第二个并行域中的任务是三角计算。因为使用了collapse(2),我不确定omp能否正确或高效地处理这类循环.

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 5月12日
  • 已采纳回答 5月4日
  • 创建了问题 8月3日

悬赏问题

  • ¥15 matlab提取运动物体的坐标
  • ¥15 人大金仓下载,有人知道怎么解决吗
  • ¥15 一个小问题,本人刚入门,哪位可以help
  • ¥15 python安卓开发
  • ¥15 使用R语言GD包一直不出结果
  • ¥15 计算机微处理器与接口技术相关问题,求解答图片的这个问题,有多少个端口,端口地址和解答问题的方法和思路,不要AI作答
  • ¥15 如何根据一个截图编写对应的HTML代码
  • ¥15 stm32标准库的PID角度环
  • ¥15 ADS已经下载好了,但是DAS下载不了,一直显示这两种情况,有什么办法吗,非常急!
  • ¥100 Excel 点击发送自动跳转outlook邮件