qq_28631871 2021-11-13 18:54 采纳率: 0%
浏览 11
已结题

SSE2 如何写 并行运算求和

unsigned char ZhiJieA[64] = { 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64 };

unsigned char ZhiJieC[16] = {};

__m128i  a;
__m128i  b;
__m128i  c;


//加载 128 位值。
 a = _mm_loadu_si128((__m128i*)ZhiJieA);//加载 128 位值。
 b = _mm_loadu_si128((__m128i*)ZhiJieA);//加载 128 位值。

 //相加                                    
 c = _mm_add_epi8(a, b);


  //取出数据

_mm_storeu_si128((__m128i*)(ZhiJieC), c);

本人刚接触 SSE指令 想请教一下 上面的代码是 按顺序 A[0]+A[1]+A[2]以此类推 显然不是我想要的

那么如何实现每间隔4个字节相加一次 比如 A[0]+A[4]+A[8]以此类推 得到最终16次相加的总数

  • 写回答

1条回答 默认 最新

  • 有问必答小助手 2021-11-15 10:44
    关注

    你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


    本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。


    因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。

    评论

报告相同问题?

问题事件

  • 系统已结题 11月21日
  • 创建了问题 11月13日

悬赏问题

  • ¥300 寻抓云闪付tn组成网页付款链接
  • ¥15 请问Ubuntu要怎么安装chrome呀?
  • ¥15 视频编码 十六进制问题
  • ¥15 Xsheii7我安装这个文件的时候跳出来另一个文件已锁定文件的无一部分进程无法访问。这个该怎么解决
  • ¥15 unity terrain打包后地形错位,跟建筑不在同一个位置,怎么办
  • ¥15 FileNotFoundError 解决方案
  • ¥15 uniapp实现如下图的图表功能
  • ¥15 u-subsection如何修改相邻两个节点样式
  • ¥30 vs2010开发 WFP(windows filtering platform)
  • ¥15 服务端控制goose报文控制块的发布问题