如何让gcc使用avx512进行自动向量化处理？

我编译一个简单的测试程序用于测试gcc自动向量化使用的是何种指令集，发现当编译参数为

-O1   -ftree-vectorize  -fopt-info-vec-optimized

编译器提示如下

gccvectortest.c:16:13: optimized: loop vectorized using 16 byte vectors

由此可以看出编译器默认使用的是128位的向量（SSE指令集）
当编译参数为

-O1 -fopenmp  -ftree-vectorize  -fopt-info-vec-optimized -march=native
或者
-O1 -fopenmp  -ftree-vectorize  -fopt-info-vec-optimized -march=skylake-avx512

编译器提示如下

gccvectortest.c:16:13: optimized: loop vectorized using 32 byte vectors
gccvectortest.c:10:5: optimized: loop vectorized using 32 byte vectors

由此可以看出编译器使用的是256位的向量（AVX指令集）,并非AVX512

环境：

CPU : Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz (支持avx512)
编译器：gcc 9.3.0
OS:Linux version 3.10.0-957.el7.x86_64

我使用的CPU架构为skyLake，是支持avx512的，但是编译器似乎无法使用avx512进行向量处理，我想知道如何让编译器使用avx512指令集进行自动向量化处理？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

gcc 自动优化for循环中未初始化的迭代变量 c++ vscode 有问必答
2022-03-13 10:07

回答 4 已采纳如果我真要弄懂这个逻辑，可能会查找计算机初始化变量分配内存得逻辑了。很简单得想，计算机底层其实就是一块连续得内存，你定义一个变量，计算机就只是从设计得内存逻辑中，去一个内存进行使用，至于里面是啥数据，
gcc 编译器和clang编译器输出结果为什么不一样？ c++ c语言
2022-09-26 11:45

回答 3 已采纳 c语言中，变量定义时是不自动初始化的而在c++中，变量定义时是自动初始化的而c和c++很多语法是兼容的所以你用不同的IDE来编译相同的代码，有时就正确，有时就错误还有，既然a是随机值，如果它随机到的值
Linux中用gcc编译程序不成功报错怎么解决？ c语言 linux ubuntu
2022-05-24 14:19

回答 1 已采纳 pthread库需要自己指明，，命令加个 -lpthread 就可以了
Apache Doris 向量化设计与实现
2022-02-27 21:19

过往记忆的博客导读：向量化技术带来极致的CPU效率的同时，也已经成为了软件开发的趋势，而数据库的向量化不仅仅是 CPU 指令的向量化，还是一个巨大的性能优化工程。本文从CPU向量化原理出发，通过Cach...
tdm-gcc下载失败，当前需要用户验证怎么解决？ c++
2023-01-04 21:19

回答 2 已采纳我帮你下载好了，放到百度网盘里了。链接：https://pan.baidu.com/s/1TbPed-e6VT4ixE8b5d8LMw?pwd=tdm6提取码：tdm6速度太慢？参考这个：https:
C语言：使用实例化的结构体定义数组时出错，如何解决？ c语言
2022-08-20 21:41

回答 1 已采纳这篇文章：C语言结构体数组，结构体数组的定义，结构体数组的输出，结构体的应用也许有你想要的答案，你可以看看
Linux下安装的vscode编译路径找不到usr/bin/gcc？ c语言 linux vscode
2022-04-19 11:25

回答 1 已采纳 usr前面少了一条斜线“/”，相对路径跟绝对路径的问题
TiFlash 面向编译器的自动向量化加速
2022-07-12 11:19

TiDB_PingCAP的博客本文将简要介绍一些在 TiFlash 中使用编译器进行自动向量化所需要的入门知识。SIMD 是重要的重要的程序加速手段。CMU DB 组在 Advanced Database Systems 中有专门的两个章节（vectorization-1, vectorization-2）...
gcc安装好了，请问怎么用gcc运行程序？（求详细） c++ c语言
2022-05-11 21:52

回答 2 已采纳编译命令：gcc XXX.c -o XXX执行命令：./XXX(XXX就是你的C文件名)
gcc安装后在VScode中运行新项目提示没有输入文件，如何解决？ vscode
2022-08-15 22:10

回答 1 已采纳因为文件名中带空格，命令行中识别不了文件名中的空格，当做参数的分隔符了。2个办法1 修改文件名，删除空格。2 修改task.json中的args，把"${file}"修改为""${file}"",，用
为什么gcc编译的时候出错？Abort trap: 6 signal terminated program cc1 c语言
2022-05-12 15:47

回答 2 已采纳好家伙，原来是gcc必须放到/usr/local/下面，不能放到电脑上其他位置，结束回答！
Eigen向量化内存对齐/Eigen的SSE兼容，内存分配/EIGEN_MAKE_ALIGNED_OPERATOR_NEW
2022-01-13 23:06

大江东去浪淘尽千古风流人物的博客对于嵌套的自定义类型，申请栈内存时会自动保证其内部数据类型的对齐，而申请堆内存时仍然需要重写operator new。有一种特殊情况本文并未提到，如果使用std::vector ，需要传入自定义内存申请器，即std::vector<...
gcc编译的时候是不是以函数为单位的？
2017-04-30 14:28

回答 3 已采纳经历4个阶段，预处理，编译，汇编，链接；无论你的.c文件中有多少个函数，都是经历这样的一个过程。望楼主采纳！
从Eigen向量化谈内存对齐
2021-09-30 08:24

3Ｄ视觉工坊的博客阴差阳错之间，我发现关闭-march=native这个编译选项后就能正常运行，而这个编译选项其实是告诉编译器当前的处理器支持哪些SIMD指令集，Eigen中又恰好使用了SSE、AVX等指令集进行向量化加速。此时，机智的我发现...
cmake怎么编译 eigen c++_从Eigen向量化谈内存对齐
2020-11-20 23:34

weixin_39793434的博客缘起Eigen是一个非常常用的矩阵...我的程序原本在NVIDIA TX2上跑的好好的，直到有一天，我打算把它放到服务器上，看看传说中的RTX 2080GPU能不能加速一把。结果悲剧发生了，编译正常，但是一运行就立即double free...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月4日

悬赏问题

¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮

如何让gcc使用avx512进行自动向量化处理？

由此可以看出编译器使用的是256位的向量（AVX指令集）,并非AVX512

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新