神经网络模型的压缩和加速都有哪些方法？

当前一些SOTA算法精度高，但是网络模型太大，无法部署在一些嵌入式设备上，现在有哪些模型压缩和加速的方法呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
AI 菌人工智能领域优质创作者 2021-03-25 21:54
关注
神经网络模型的压缩与加速方法,从大的方面来讲一共有七类，分别是：参数剪枝、参数量化、紧凑网络、知识蒸馏、低秩分解、参数共享和混合方式。下面分别简单阐述一下：

(1) 参数剪枝是指在预训练好的大型模型的基础上,设计对网络参数的评价准则,以此为根据删除“冗余”参数.

(2) 参数量化是指用较低位宽表示典型的 32 位浮点网络参数,网络参数包括权重、激活值、梯度和误差等等,可以使用统一的位宽(如 16-bit、8-bit、2-bit 和 1-bit 等),也可以根据经验或一定策略自由组合不同的位宽。

(3) 低秩分解是指通过合并维数和施加低秩约束的方式稀疏化卷积核矩阵,由于权值向量大多分布在低秩子空间,所以可以用少数的基向量来重构卷积核矩阵,达到缩小存储空间的目的。

(4) 参数共享是指利用结构化矩阵或聚类等方法映射网络参数,减少参数数量.参数共享方法的原理与参数剪枝类似,都是利用参数存在大量冗余的特点,目的都是为了减少参数数量.

(5) 设计更紧凑的新型网络结构,是一种新兴的网络压缩与加速理念,构造特殊结构的 filter、网络层甚至网络,从头训练,获得适宜部署到移动平台等资源有限设备的网络性能,不再需要像参数压缩类方法那样专门存储预训练模型,也不需要通过微调来提升性能,降低了时间成本,具有存储量小、计算量低和网络性能好的特点.

(6) 知识蒸馏最早由 Buciluǎ 等人提出,用以训练带有伪数据标记的强分类器的压缩模型和复制原始分类器的输出.与其他压缩与加速方法只使用需要被压缩的目标网络不同,知识蒸馏法需要两种类型的网络:教师模型和学生模型.

(7)以上这些压缩与加速方法单独使用时能够获得很好的效果,但也都存在各自的局限性,组合使用可使它们互为补充

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

神经网络模型的压缩和加速都有哪些方法？人工智能
2021-03-25 11:32

回答 2 已采纳 神经网络模型的压缩与加速方法,从大的方面来讲一共有七类，分别是：参数剪枝、参数量化、紧凑网络、知识蒸馏、低秩分解、参数共享和混合方式。下面分别简单阐述一下： (1) 参数剪枝是指在预训练好的大型模型
神经网络中的模型和算法有什么区别？深度学习神经网络
2022-04-06 10:05

回答 2 已采纳模型就是一堆参数，可以理解为算法中的变量；算法是一堆数学公式，这些公式使用模型中的参数作为变量值来进行计算，以达到预测或分类功能。算法分为训练和预测两个部分，训练算法用训练数据来构建模型，预测算法用模
优化神经网络训练方法有哪些？人工智能机器学习深度学习
2022-09-06 10:13

回答 2 已采纳 1 考虑换一种学习率 schedule2 在 DataLoader 中使用多个 worker 和页锁定内存3 把 batch 调到最大4 使用自动混合精度（AMP）5 考虑使用另一种优化器6 cudN
当前深度神经网络模型压缩和加速都有哪些方法？
2018-04-24 00:00

PaperWeekly的博客在碎片化阅读充斥眼球的时代，越来越少的人会去关注每篇论文背后的探索和思考。在这个栏目里，你会快速 get 每篇精选论文的亮点和痛点，时刻紧跟 AI 前沿成果。点击本文底部...
进行神经网络训练之前，对于测试集数据进行特征工程的常见方法有哪些？ pytorch 深度学习神经网络
2021-12-23 10:25

回答 1 已采纳特征工程处理方法的话主要是特征清洗和特征预处理特征清洗主要是针对特征是否有缺失值、数据标签失衡的一些大问题，你可以进行删增之类的。特征预处理主要有对特征进行归一化(这个十分重要，特别是你数据高度稀疏的
如何将训练好的BP神经网络模型保存并可以在其他py文件中直接调用？ python 有问必答机器学习神经网络
2021-06-09 10:53

回答 2 已采纳这个需要建立字典封装起来
常用的迁移学习模型有哪些呢？人工智能机器学习深度学习神经网络
2020-03-11 22:00

回答 1 已采纳 Fine-tune, 多任务学习， zero-shot学习，持续学习
深度神经网络压缩和加速详解
2021-12-17 15:07

心之所向521的博客深度学习模型的压缩和加速是指利用神经网络参数的冗余性和网络结构的冗余性精简模型,在不影响任务完成度的情况下,得到参数量更少、结构更精简的模型.被压缩后的模型计算资源需求和内存需求更小,相比原始模型能够...
2021年了，有哪些稳压bert和roberta的预训练模型？人工智能机器学习深度学习神经网络自然语言处理
2021-01-20 14:38

回答 1 已采纳 https://arxiv.org/abs/2106.11483
网络和数据库，哪个与人工智能关系大？人工智能机器学习神经网络
2023-02-08 23:54

回答 3 已采纳如果你想学习人工智能，初学者应该先从数据库方面入手，因为数据库是人工智能的基础。数据库是保存数据的重要工具，它可以帮助人们更好地整理、管理和分析数据，从而有效地为人工智能应用程序提供所需的信息。另外，
python构建神经网络训练模型的问题？ python 有问必答深度学习神经网络
2021-04-11 17:39

回答 3 已采纳 input_shape=(7787,)这里是不是少了一个参数
当前深度神经网络模型压缩和加速方法速览
2017-11-04 09:23

老司机的诗和远方的博客 “本文介绍的论文全面概述了深度神经网络的压缩方法，主要可分为参数修剪与共享、低秩分解、迁移/压缩卷积滤波器和知识精炼，本论文对每一类方法的性能、相关应用、优势和缺陷等进行独到的分析。” 大型...
一道人工智能神经网络的题人工智能深度学习神经网络
2022-06-09 23:27

回答 5 已采纳输出层线性激活函数的话，预测结果为[1,0]
综述论文：当前深度神经网络模型压缩和加速方法速览
2019-06-05 10:11

洛北辰南的博客本文全面概述了深度神经网络的压缩方法，主要可分为参数修剪与共享、低秩分解、迁移/压缩卷积滤波器和知识精炼，本论文对每一类方法的性能、相关应用、优势和缺陷等进行独到的分析。机器之心简要介绍了该论文，更...
人工智能-深度学习：神经网络模型压缩技术（Network Compression）
2020-12-24 23:32

u013250861的博客一般情况下，CNN网络的深度和效果成正比，网络...- 为了让神经网络模型能很好地运行在前端移动设备上，PVANet、MobileNet、ShuffleNet 是网络设计层面的思路，这里不展开，这里主要讲的是基于已训练网络的简化方法。
没有解决我的问题, 去提问

悬赏问题

¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 AT89C51控制8位八段数码管显示时钟。
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 下图接收小电路，谁知道原理
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
¥15 ETLCloud 处理json多层级问题

神经网络模型的压缩和加速都有哪些方法？

2条回答 默认 最新

悬赏问题

2条回答默认最新