深度学习训练过程，学习率设置低，训练准确率就高

图像识别过程，使用深度学习算法，训练阶段，将学习率设置的越低，训练准确率增长的越快。当然，也越容易过拟合。搞不懂其中的原因，为什么低学习率会使训练准确率增长的迅速？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蔡能教授，网站特聘专家 2019-11-11 10:38
关注
首先一点，我习惯讲问题，很啰嗦。因为我想把问题讲的连之前不知道的人都可以清楚明白。你不介意就继续看吧。
第一个：我们训练模型其实在做什么。
神经网络模型本质就是一个算法，一个组合的算法。我们训练神经网络其实是在调参，让这个算法符合我们想要的效果。
第二个：什么是过拟合
网络调参是依据样本去调整算法。当我们根据样本调参出来的算法太过符合样本时，就对新数据效果不好。比如我分辩是不是狗。我样本都是二哈，这样调整的网络参数都是二哈的。现在识别新数据——金毛，就会识别金毛不是狗。
这就是过拟合。调出来的参数太符合样本了。
第三个：解决方法
过拟合就是参数调的太符合样本，所以解决的方法就有两方面
1.样本。原本样本只有二哈的，导致参数符合二哈，现在增加样本种类和大小，这样参数调整出来就符合更多狗的。
2.参数。让参数调整的没那么好。这就衍生出正则化、dropout等方法。正则化就是在loss函数加一项，这样出来的参数就有那一项的影响，不会太符合样本特征了。
dropout就是在每次迭代训练时随机丢一些单元，这次不参与，这样每次模拟的就不是基于全部，出来的参数就不会太符合样本了。
其实无论哪种方法都是基于参数调整方面出发。

解决 8
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

实验记录：可能造成深度学习模型训练过程中准确率振荡的原因
2023-12-17 20:11

爱编程的小金毛球球的博客可能造成深度学习模型训练过程中准确率振荡的原因有哪些
深度学习：CNN 模型训练中的学习率调整（基于 PyTorch）
2025-09-05 10:31

山烛的博客当预设策略无法满足需求时，可通过LambdaLR自定义学习率调整规则，支持为不同层设置不同学习率（如微调预训练 CNN 时，对浅层和深层采用不同学习率）。原理：通过lr_lambda函数定义学习率与 epoch 的关系，函数输入...
深度学习，训练集准确率高，但验证集准确率一直不上升，很低的问题
2025-01-06 14:48

开心邮递员的博客在训练过程中，训练集的准确率稳步上升，但是验证集的准确率一直在40%左右徘徊，从网上搜索可能的原因有： 1、学习率太小，陷入局部最优。 2、数据量太小（4000多条数据，应该还可以吧） 3、训练集和测试集数据...
深度学习中的学习率调整策略：优化模型训练的关键
2024-09-25 21:18

湫ccc的博客在深度学习模型训练中，选择优化器不当会发生梯度消失或者梯度爆炸的问题，而学习率如果设置的不当也会发生同样的问题。学习率是一个至关重要的超参数。本文将详细介绍学习率的概念、学习率调整的重要性以及常用的...
PyTorch深度学习实战（1）——神经网络与模型训练过程详解
2023-05-28 08:06

盼小辉丶的博客在本节中，我们将了解传统机器学习与人工神经网络间的差异，并了解如何在实现前向传播之前连接网络的各个层，以计算与网络当前权重对应的损失值；实现反向传播以优化权重达到最小化损失值的目标。并将实现网络的所有...
基于深度学习的肺结节检测系统内含数据集和环境搭建教程准确率达到97.8%.zip
2024-03-30 00:07

本项目提供了一个基于深度学习的肺结节检测系统，该系统经过训练，准确率达到了97.8%，这在医疗图像分析中是一个非常高的指标，对于临床应用具有极高的价值。首先，我们来谈谈深度学习。深度学习是一种机器学习...
【深度学习】2-模型在测试集的准确率大于训练集
2022-08-07 21:09

清风莫追的博客在模型训练过程中突然发现，模型的准确率在测试集上居然比在训练集上还要高。但是我们知道，我们训练模型的方式就是在训练集上最小化损失。因此，模型在训练集上有着更好的表现，才应该是正常的现象。那么，是什么...
深度学习模型训练中 学习率参数设置大小问题及设置合适值
2024-06-20 22:45

视觉研坊的博客选择和调整合适的学习率是深度学习训练中至关重要的一部分。
深度学习中学习率和batchsize对模型准确率的影响
2020-11-07 23:40

初识-CV的博客目前深度学习模型多采用批量随机梯度下降算法进行优化，随机梯度下降算法的原理如下: n是批量大小(batchsize)，η是学习率(learning rate)。可知道除了梯度本身，这两个因子直接决定了模型的权重更新，从优化本身来...
深度学习模型是如何训练的，一文让你理解深度学习全过程并搭建简单的深度学习模型
2025-08-21 10:43

SANQIUYE哦的博客文章包含完整的代码实现，包括数据归一化、网络结构定义、损失函数和优化器配置等，并提供了训练过程的准确率和损失值监控方法。最后总结了深度学习模型训练的基本思路，鼓励读者通过修改不同模块来观察模型效果变化...
没有解决我的问题, 去提问

深度学习训练过程，学习率设置低，训练准确率就高

4条回答 默认 最新

4条回答默认最新