深度学习训练过程，学习率设置低，训练准确率就高

图像识别过程，使用深度学习算法，训练阶段，将学习率设置的越低，训练准确率增长的越快。当然，也越容易过拟合。搞不懂其中的原因，为什么低学习率会使训练准确率增长的迅速？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蔡能教授，网站特聘专家 2019-11-11 10:38
关注
首先一点，我习惯讲问题，很啰嗦。因为我想把问题讲的连之前不知道的人都可以清楚明白。你不介意就继续看吧。
第一个：我们训练模型其实在做什么。
神经网络模型本质就是一个算法，一个组合的算法。我们训练神经网络其实是在调参，让这个算法符合我们想要的效果。
第二个：什么是过拟合
网络调参是依据样本去调整算法。当我们根据样本调参出来的算法太过符合样本时，就对新数据效果不好。比如我分辩是不是狗。我样本都是二哈，这样调整的网络参数都是二哈的。现在识别新数据——金毛，就会识别金毛不是狗。
这就是过拟合。调出来的参数太符合样本了。
第三个：解决方法
过拟合就是参数调的太符合样本，所以解决的方法就有两方面
1.样本。原本样本只有二哈的，导致参数符合二哈，现在增加样本种类和大小，这样参数调整出来就符合更多狗的。
2.参数。让参数调整的没那么好。这就衍生出正则化、dropout等方法。正则化就是在loss函数加一项，这样出来的参数就有那一项的影响，不会太符合样本特征了。
dropout就是在每次迭代训练时随机丢一些单元，这次不参与，这样每次模拟的就不是基于全部，出来的参数就不会太符合样本了。
其实无论哪种方法都是基于参数调整方面出发。

解决 8
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为何每次训练出来的准确率有差异？ tensorflow 人工智能机器学习深度学习神经网络
2019-07-31 01:03

回答 1 已采纳一点点差异很正常，因为你的参数都是随机化的。
yolov5训练精度低 python 人工智能深度学习
2023-03-21 09:49

回答 3 已采纳数据集出现问题了。你应该贴出来其他数据集统计图片看下，比如标签长宽统计，数据集类别数目统计等等。没有这些只能猜测目前你数据集可能存在的问题。1.看了下你的类名，是做吸烟检测吗？那你是不是图片太大了，检
为什么我改变图像通道会导致神经网络分类准确率下降？人工智能深度学习神经网络
2021-02-25 16:07

回答 2 已采纳这证明经过dct变换、局部二值模式处理后，损失了部分有效图像特征；或者灰度图、二值处理图、dct图在三个通道对应分量上的特征无法组合成更优图像特征。这在神经网络调参过程中是很常见的，明明觉得处理一下分
实验记录：可能造成深度学习模型训练过程中准确率振荡的原因
2023-12-17 20:11

爱编程的小金毛球球的博客可能造成深度学习模型训练过程中准确率振荡的原因有哪些
同一数据集划分不同类别，会影响神经网络分类准确率吗人工智能深度学习神经网络
2023-03-02 22:15

回答 1 已采纳基于Monster 组和GPT的调写：假设两个 VGG16 网络使用不同的训练集进行训练，其中训练集的类别不完全相同。虽然训练集中的“人”和“狗”类别相同，但其中一个网络在训练集中包含更多的猫类别。
可是最终用测试集验证模型却只有0.3的准确率，请问是怎么回事啊？ tensorflow 人工智能机器学习深度学习
2021-02-25 00:59

回答 4 已采纳模型的泛化能力不行，即训练集数据覆盖范围小了，并没有覆盖到大部分情况。举个例子来说，你训练的数据都是圆形的，你用来测试矩形，那肯定不行啊。
使用keras画出模型准确率评估的执行结果时出现： tensorflow 人工智能深度学习神经网络
2019-10-17 00:40

回答 1 已采纳理论上应该没有问题啊，你要不试试把最后的'acc'改为'accuracy'，好像有些情况'acc'会报错
基于深度学习的情感分析模型,经过外卖评论和酒店评论的训练，准确率在90%左右.zip
2024-02-19 13:14

人工智能-项目实践-深度学习
pytorch利用卷积神经网络实现验证码识别，但是在写测试集的准确率函数时遇到问题 python 人工智能机器学习深度学习神经网络
2020-02-23 12:13

回答 1 已采纳 target是标签（参考答案），output是输出（你的答案）两者zip连接以后循环 if equal（相等） list添加一个1 否则添加一个0 正确率 = 列表中所有1的个数 /. 列
语义分割模型训练，发现验证集的loss值震荡，而精度却正常提升，这是怎么回事？？ python 人工智能机器学习深度学习神经网络
2020-03-09 08:35

回答 1 已采纳现象很正常啊，遇到陌生的数据损失肯定会高，loss肯定是在震荡但整体呈下降趋势的
vgg19训练图像分类，分成两类，这样训练出来的网络是否过拟合了？人工智能机器学习深度学习
2021-03-23 15:58

回答 3 已采纳 1k5左右就差不多了，过拟合的话不一定，要看下有没有防止过拟合的手段，如果你的项目是开源项目的话，一般会有这方面的限制的。
深度学习训练技巧--- 学习率
2023-03-17 01:01

挪威的深林的博客 深度学习学习率的设置如何获得最高性能的模型
训练数据时，什么情况下要用class_weight，什么情况下不用会更好？ tensorflow 人工智能机器学习深度学习神经网络
2019-07-31 12:12

回答 1 已采纳这个需要依据实验结果，class_weighty一般在数据不平衡情况下使用，还有一些分类效果不理想情况下使用
基于深度学习的情感分析模型源码（经过外卖评论和酒店评论的训练，准确率在90%左右）.zip
2024-01-18 07:59

1、该资源内项目代码经过严格调试，下载即用确保可以运行！ 2、该资源适合计算机相关专业(如计科、人工智能、大数据、数学、...基于深度学习的情感分析模型源码（经过外卖评论和酒店评论的训练，准确率在90%左右）.zip
【深度学习】2-模型在测试集的准确率大于训练集
2022-08-07 21:09

清风莫追的博客在模型训练过程中突然发现，模型的准确率在测试集上居然比在训练集上还要高。但是我们知道，我们训练模型的方式就是在训练集上最小化损失。因此，模型在训练集上有着更好的表现，才应该是正常的现象。那么，是什么...
没有解决我的问题, 去提问

悬赏问题

¥15 孟德尔随机化结果不一致
¥15 apm2.8飞控罗盘bad health，加速度计校准失败
¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
¥15 谁有desed数据集呀
¥20 手写数字识别运行c仿真时，程序报错错误代码sim211-100
¥15 关于#hadoop#的问题
¥15 (标签-Python|关键词-socket)
¥15 keil里为什么main.c定义的函数在it.c调用不了
¥50 切换TabTip键盘的输入法
¥15 可否在不同线程中调用封装数据库操作的类

深度学习训练过程，学习率设置低，训练准确率就高

4条回答 默认 最新

悬赏问题

4条回答默认最新