LSTM模型训练过拟合问题。

使用ConvLSTM预测图像序列总是出现过拟合的问题，数据集是Moving MNIST 移动数据集，前10帧预测后10帧，训练集11000个序列，验证集1000个序列，优化器Adam，学习率0.001，batch_size=10，MSE做损失函数。

已尝试增加normalization、dropout、梯度裁剪、L1与L2正则10e-6、10e-5、10e-4都无法解决过拟合的问题

图片说明

橙色为训练集损失，蓝色为验证集损失，验证集损失训练一段时间开始上升。
请问这种情况该怎样解决？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-09-15 10:33
关注
没办法，你的训练样本太少。增加训练样本是唯一的办法。
好比吃不饱饭怎么办，不增加饭，采用稀饭掺水，少餐多顿这些办法都治标不治本。

所以你看即便it大厂，也在拼命积攒数据以及人工标注数据，花费大量成本，如果算法能解决，何必如此。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2

无用 5
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

LSTM模型训练过拟合问题。 python 人工智能深度学习神经网络
2020-09-15 10:21

回答 1 已采纳没办法，你的训练样本太少。增加训练样本是唯一的办法。好比吃不饱饭怎么办，不增加饭，采用稀饭掺水，少餐多顿这些办法都治标不治本。所以你看即便it大厂，也在拼命积攒数据以及人工标注数据，花费大
lstm时间序列预测过拟合问题 lstm python 有问必答
2021-09-16 20:21

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
LSTM模型可以训练怎样的数据集？人工智能深度学习神经网络自然语言处理
2020-04-18 17:08

回答 1 已采纳 LSTM主要用来学习序列，并且序列的变化的影响因子和序列本身有关或者周期性波动。比如说文本预测，每天每周每年的销量别的也可以学，但是效果未必很好。
【翻译】如何诊断lstm模型的过拟合与欠拟合
2020-09-05 17:12

Troye Jcan的博客原文地址 It can be difficult to determine whether your ...很难确定您的LSTM模型在序列预测问题上是否表现良好。 You may be getting a good model skill score, but it is important to know whether your model
LSTM模型如何进行新数据的预测？ python 人工智能机器学习深度学习神经网络
2019-07-04 15:21

回答 2 已采纳创建一个预测数组，每预测一个Y就往数组里放一个，同时更新你用来预测的自变量X数组，剔除最早的X，把预测值加入到X里，依次往后预测
关于#lstm#的问题：lstm训练，padding 补0后,模型不收敛 lstm pytorch 时序数据库
2022-07-20 18:43

回答 2 已采纳直接划分60s滑动窗口不行嘛
pytorch训练LSTM模型的代码疑问 python 人工智能深度学习神经网络
2019-08-09 11:55

回答 2 已采纳 ``` def __init__(self): super(Sequence,self).__init__() self.lstm1 = nn.LSTMCel
CNN-LSTM模型训练及预测瓦斯浓度
2024-03-05 16:41

NURBS.的博客提取所需列存入新的文件，去除异常值的同时也保留了所需要的含有时间序列和空间序列的数据，再对含有时间序列和空间序列的数据进行处理以及设置瓦斯浓度为标签数据，然后对数据进行了分类，包括训练集，验证集以及...
关于LSTM模型提取数据特征 tensorflow 人工智能深度学习自然语言处理
2020-04-24 23:35

回答 1 已采纳用fit训练，用predict预测－－－－－－－－－－－－－－－－－－－－－－－－－－－本来还想多说几句的，一看之前的回答都没有采纳。当我白说
使用Keras编写的LSTM，训练时出现loss: nan - val_loss: nan，该如何调整？ keras lstm 有问必答深度学习
2022-05-03 18:40

回答 2 已采纳原数据第一列是时间形式的20220503这种，在读数据之后进行下面操作，你的数据是简单的1 2 34这种，数据可能在处理过程丢失或者变成nan了，你可以一步步看看每次处理后当前的数据现在是什么格式 d
找的lstm模型里没有学习率这个参数 python
2021-07-21 10:15

回答 2 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 请看👉 ：深度学习-利用LSTM预测多输出如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
【模型优化】增加数据量解决模型过拟合问题
2023-10-30 17:28

王摇摆的博客监控验证集的性能，在验证集上性能不再提升时停止训练，以避免模型在训练数据上过拟合。使用 L1 或 L2 正则化来限制模型参数的大小，防止模型过分拟合训练数据。使用多个模型的组合，比如随机森林、梯度提升树等，...
如何使用LSTM和Transform等经典模型 lstm transformer 自然语言处理
2022-10-12 20:31

回答 1 已采纳建议换pytorch，信我，tensorflow坑巨多，还有各个版本之间的api兼容性，cuda兼容性巨差，旧版本的代码（1.08-1.15）在新版本（2.x）基本上跑不动,而一些旧的代码基本上都是1
python lstm 模型训练好后如何使用_用Python结合人工智能尝试预测股票，会成就下一个股神？
2020-11-02 09:33

weixin_39899226的博客现在在人工智能时代，Python+AI框架，无疑会利用人工智能优势可以对股票市场进行特征学习，抓取比凭借个人感觉更多的股票数字特征。本文要介绍的就是利用Python+keras对股票进行时间序列上的数字特征预测。用Python...
python实现基于长短期记忆网络LSTM模型预测茅台股票价格趋势
2023-06-07 16:34

艾派森的博客深度学习算法通过多层神经网络的构建，以及大规模数据的训练和优化，可以从数据中提取更加丰富、高级的特征表示，从而提供更准确、更稳定的预测和决策能力。在金融领域，深度学习算法已经被广泛应用于多个关键任务。...
没有解决我的问题, 去提问

悬赏问题

¥17 pro*C预编译“闪回查询”报错SCN不能识别
¥15 微信会员卡接入微信支付商户号收款
¥15 如何获取烟草零售终端数据
¥15 数学建模招标中位数问题
¥15 phython路径名过长报错不知道什么问题
¥15 深度学习中模型转换该怎么实现
¥15 Stata外部命令安装问题求帮助！
¥15 从键盘随机输入A-H中的一串字符串，用七段数码管方法进行绘制。提交代码及运行截图。
¥15 TYPCE母转母，插入认方向
¥15 如何用python向钉钉机器人发送可以放大的图片？

LSTM模型训练过拟合问题。

1条回答 默认 最新

悬赏问题

1条回答默认最新