神经网络训练时，损失值在0.1波动，不再下降，是否认为已经收敛？

在利用卷积神经网络训练一组数据时，损失值从3.7左右下降到0.15左右，之后损失值不再下降，这种情况是否可以认为已经收敛？但此时的测试集准确率只有92%左右，如果想要继续提高准确率，应该从哪方面入手：数据集本身？网络模型？训练参数？还是其它方面？
这是训练的两张图：图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-01-09 11:41
关注
一个是本身数据的可学习性，一个是模型的问题。一个是网络调参不好。
打一个比方，如果仅仅用每天的天气数据预测每天的股票价格，怎么预测都误差很大，这个就是可学习性差。可学习性差表现为过拟合。
而用一个只有单层10个神经元的网络去判别图片，这个就是模型的问题。模型不好主要表现在学不动，不收敛。
还有一个就是网络调参，比如说虽然你的网络复杂性够了，数据也OK，但是优化器不好，导致梯度消失，过早收敛，这个你要换优化器的算法，必要的时候可以用网格搜索的方式手动调参。

解决 5

无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

神经网络训练集损失值降为0而且一直保持 python 深度学习神经网络
2022-02-25 12:13

回答 1 已采纳（1）你没有给出模型，数据情况，谁也分析不了（2）训练误差小，测试误差大，这是典型的过拟合（3）损失值降为 0，还是下降很快，接近于 0，这是完全不同的，从问题描述和图中看不出来
使用mnist数据搭建的神经网络训练时GPU占用率剧烈波动人工智能机器学习神经网络
2023-04-08 12:36

回答 1 已采纳 mnist数据集太小了，所以gpu用不满，这是很正常的
如何将训练好的BP神经网络模型保存并可以在其他py文件中直接调用？ python 有问必答机器学习神经网络
2021-06-09 10:53

回答 2 已采纳这个需要建立字典封装起来
神经网络训练不收敛或训练失败的原因总结
2023-06-07 10:13

小白学视觉的博客点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达前言本文分别从数据方面和模型方面分析了导致模型训练不收敛或失败的原因，数据方面总结了四种可能的原因，模型方面总结了九种可能的问题。...
为什么我改变图像通道会导致神经网络分类准确率下降？人工智能深度学习神经网络
2021-02-25 16:07

回答 2 已采纳这证明经过dct变换、局部二值模式处理后，损失了部分有效图像特征；或者灰度图、二值处理图、dct图在三个通道对应分量上的特征无法组合成更优图像特征。这在神经网络调参过程中是很常见的，明明觉得处理一下分
深度神经网络训练过程中，损失函数的值没有变化神经网络
2017-07-04 07:37

回答 1 已采纳问题解决了，是激活函数的问题，relu激活函数的激活率太低，很多神经元死掉了
BP神经网络预测应力时，输出层和最终得到的应力值的映射关系是什么? 神经网络
2022-02-27 09:24

回答 2 已采纳如果输出层的取值范围是 [0,1]（并不是所有的 BP 都是这样），那么应该对训练样本的输出进行归一化，即现将应力值映射到 [0,max] 范围内，或者映射到 [min,max]，或者某一适当的范围如
总结 | 神经网络训练不收敛或训练失败的原因
2023-03-28 10:06

小白学视觉的博客点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达编者荐语文章分别从数据方面和模型方面分析了导致模型训练不收敛或失败的原因，数据方面总结了四种可能的原因，模型方面总结了九种可能的问题...
python构建神经网络训练模型的问题？ python 有问必答深度学习神经网络
2021-04-11 17:39

回答 3 已采纳 input_shape=(7787,)这里是不是少了一个参数
看损失函数的收敛过程可以评价网络的优劣吗？分类深度学习神经网络
2021-07-29 18:06

回答 1 已采纳收敛快慢只能说你的训练速度加快，但是网络的优劣一般不看你的网络收敛速度，收敛速度加快只能说训练时间短了一些，一般来说准确率更为看重一点，在保证准确率的前提下尽可能的精简网络结构，加快收敛，但是你这个准
神经网络在训练时怎么对模型进行加密，并在解密时传入模型进行验证？ c++ cnn python
2022-11-07 14:56

回答 1 已采纳使用base64吧，将模型转成字节流然后加密保存到本地，每次读取的时候解密到内存中，从内存中加载模型。
神经网络中的损失函数与拟合问题
2023-07-06 14:31

啤酒泡泡_Lyla的博客本博客为个人学习专用，内容来自书本，网络资料等做出的总结
训练神经网络值发生错误，时版本问题吗？ python 数据挖掘机器学习
2021-06-01 11:06

回答 1 已采纳不是，是维度不匹配，打印下输入的tensor维度，看看tensor和层之间的参数是否匹配。如有帮助请采纳
【深度学习】神经网络训练过程中不收敛或者训练失败的原因
2023-11-27 12:48

TwcatL_tree的博客在面对模型不收敛的时候，首先要保证训练的次数够多。在训练过程中，loss并不是一直在下降，准确率一直在提升的，会有一些震荡存在。train loss 不断上升，test loss不断上升，说明网络结构设计不当，训练超参数设置...
神经网络模型不收敛原因、解决办法
2020-05-22 19:06

褚骏逸的博客目录0.可能原因汇总1.检查1.1.确保：数据干净、标注正确1.2.样本的信息量太大1.3.确保：归一化、标准化1.4....理论上，只要训练样本足够多，神经网络可以拟合原始数据分布。 0.可能原因汇总没有对数据进行归一化忘
没有解决我的问题, 去提问

悬赏问题

¥15 Python爬取指定微博话题下的内容，保存为txt
¥15 vue2登录调用后端接口如何实现
¥65 永磁型步进电机PID算法
¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥15 latex怎么处理论文引理引用参考文献
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？

神经网络训练时，损失值在0.1波动，不再下降，是否认为已经收敛？

1条回答 默认 最新

悬赏问题

1条回答默认最新