神经网络学习率自适应相关问题，动量法

网上看到这句话“中期以及现在最普及的就是引入动量因子：
Δxt=ρΔxt−1−η⋅gt
ρ为动量因子，通常设为0.9
在更新中引入0.9这样的不平衡因子，使得：
★在下降初期，使用前一次的大比重下降方向，加速。
★在越过函数谷面时，异常的学习率，会使得两次更新方向基本相反，在原地”震荡“
此时，动量因子使得更新幅度减小，协助越过函数谷面。
★在下降中后期，函数面局部最小值所在的吸引盆数量较多，一旦陷进吸引盆当中，
Gradient→0
Gradient→0
，但是前后两次更新方向基本相同。
此时，动量因子使得更新幅度增大，协助跃出吸引盆。”
我想问的是：
1、Δxt是否就是每次训练的负梯度，那gt又是代表什么。
2、“谷面”和“吸引盆”感觉好像一个意思，这个有啥区别。
3、Gradient代表什么

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
宇宙神灵 2020-03-16 11:12
关注
迭代正常写是x[t+1] = x[t] - η * g[t]，η是学习率，g[t]是梯度。
转换下：Δx[t] = x[t+1] - x[t] = - η * g[t]
加入动量（momentum）后的更新公式为
Δx[t] = - η * g[t] + ρ * Δx[t-1]
如楼上所说，吸引盆（这个名字谁起的）和谷面应该都是局部最优解的意思。
比较直观的作用是：
1）假如现在x[t]靠近局部最优解，那么不带动量的Δx[t-1]和Δx[t]的方向应该是一致的，加上动量的话，就会加强Δx[t]在这个方向的更新力度，有助于
帮助跳出局部最优解；
2）训练刚开始时，参数离局部最优解（或全局）位置都比较远，这个时候学习率和梯度都比较大，Δx[t-1]和Δx[t]的方向很大概率时不一致的，不加动量的话，x[t]容易乱跳，而加上动量，Δx[t-1]能够抵消一部分Δx[t]，缓解这种现象。

以上是我自己的理解。。。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

神经网络学习率自适应相关问题，动量法人工智能机器学习深度学习神经网络
2020-03-13 10:00

回答 2 已采纳迭代正常写是x[t+1] = x[t] - η * g[t]，η是学习率，g[t]是梯度。转换下：Δx[t] = x[t+1] - x[t] = - η * g[t] 加入动量（momentum
神经网络输出多维向量的值都一样是什么问题呀 python 机器学习神经网络
2023-02-19 11:33

回答 2 已采纳检查输入数据是否正确：确保您的输入数据已经被正确地预处理和标准化，使其能够适应网络的要求。还要确保您的输入数据与您的问题域相匹配。检查网络结构：确认您的神经网络结构是否正确并满足您的问题要求。特别是
android中ImageView的自适应问题 android
2022-07-26 15:56

回答 4 已采纳如果你是想要 - 固定 ImageView 宽度，加载图片后图片宽度撑满，高度自适应 - 类似这种的话，推荐以下方案：分以下步骤实现：使用 Gilder 等工具加载网络图片为 Bitmap获取
自适应模糊神经网络算法,什么是自适应神经网络
2022-08-26 17:12

快乐的小荣荣的博客 BP算法的基本思想是：学习过程由信号正向传播与误差的反向回传两个部分组成；正向传播时，输入样本从...2、通过各节点间的连接情况正向逐层处理后，得到神经网络的实际输出。3、计算网络实际输出与期望输出的误差。...
关于html屏幕自适应的问题 html5
2015-06-12 11:08

回答 9 已采纳做响应式网站，bootstrap就是自适应不同设备的这个问题要在网页中判断是电脑还是手机设备这个代码放在网页头文件里的css就好
现在学习软件的自适应算法和个性化推荐都是如何实现的呢？
2017-09-18 02:40

回答 1 已采纳 google 协同过滤算法单词个性化推荐？我用过扇贝，没有你说的那么玄。只是一个单词分级的匹配，而分级是根据词频和不同考试得来的。
自适应居中问题，详情请看主页 css css3 html5
2022-10-19 23:00

回答 1 已采纳 .content{ display: flex; justify-content: center; align-items: c
神经网络优化：自适应优化算法
2023-12-31 01:40

禅与计算机程序设计艺术的博客 自适应优化算法是一种常见的神经网络优化方法，它可以根据网络的梯度信息自动调整学习率，从而提高训练效率和模型性能。在这篇文章中，我们将深入探讨自适应优化算法的核心概念、算法原理、具体实现以及应用示例。 ...
前端css文字自适应问题 html5
2023-02-10 21:42

回答 2 已采纳 CSS 提供了一个可以直接实现文字大小随容器大小变化的属性值：vw 和 vh。 vw (Viewport Width) 单位表示文字大小相对于当前视口宽度的百分比，例如：font-size: 5vw
vue页面自适应问题窗口缩小页面元素也缩小 javascript vue.js 前端
2023-04-23 20:21

回答 2 已采纳我去看了一下黑神话的他是屏幕变化中在修改图片的宽度高度是没有变化你为什么要修改你的高度呢
html中margin的自适应问题 css html5
2019-09-27 17:18

回答 2 已采纳 margin:0 auto;是设置对象上下间距为0，左右自动；但没有设置对象内文本对象，所以需要在#title1中添加text-align: center;设置文本居中
intellectual.rar_人工智能/神经网络/深度学习_PDF_
2021-08-12 03:00

探讨了动量系数和学习率自适应调整的神经网络算法障的特征识别方法的旋转机械故障智能诊断系统
自适应布局遇到的问题 css3 html5 前端
2022-07-11 17:22

回答 4 已采纳 html body 以及你需要自适应盒子的高度都为100%
机器学习--神经网络训练：学习速率自我调节
2023-10-28 13:32

ちゆきー的博客现在我们的优化方式是通过动量（考虑前面所有梯度的矢量和）来决定方向，Root Mean Square来表示大小，然后再配上学习速率衰减。
神经网络优化：学习率的选择和调整
2023-12-27 18:07

禅与计算机程序设计艺术的博客 神经网络是人工智能领域的一种重要技术，它可以用于解决各种问题，包括图像识别、自然语言处理、游戏等。在训练神经网络时，我们需要选择合适的学习率来优化模型。学习率是指算法在梯度下降过程中每次更新权重时的...
没有解决我的问题, 去提问

悬赏问题

¥20 usb设备兼容性问题
¥15 错误(10048): “调用exui内部功能”库命令的参数“参数4”不能接受空数据。怎么解决啊
¥15 安装svn网络有问题怎么办
¥15 Python爬取指定微博话题下的内容，保存为txt
¥15 vue2登录调用后端接口如何实现
¥65 永磁型步进电机PID算法
¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)

神经网络学习率自适应相关问题，动量法

2条回答 默认 最新

悬赏问题

2条回答默认最新