LSTM模型训练过拟合问题。

使用ConvLSTM预测图像序列总是出现过拟合的问题，数据集是Moving MNIST 移动数据集，前10帧预测后10帧，训练集11000个序列，验证集1000个序列，优化器Adam，学习率0.001，batch_size=10，MSE做损失函数。

已尝试增加normalization、dropout、梯度裁剪、L1与L2正则10e-6、10e-5、10e-4都无法解决过拟合的问题

图片说明

橙色为训练集损失，蓝色为验证集损失，验证集损失训练一段时间开始上升。
请问这种情况该怎样解决？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-09-15 10:33
关注
没办法，你的训练样本太少。增加训练样本是唯一的办法。
好比吃不饱饭怎么办，不增加饭，采用稀饭掺水，少餐多顿这些办法都治标不治本。

所以你看即便it大厂，也在拼命积攒数据以及人工标注数据，花费大量成本，如果算法能解决，何必如此。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2

无用 5
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【翻译】如何诊断lstm模型的过拟合与欠拟合
2020-09-05 17:12

Troye Jcan的博客原文地址 It can be difficult to determine whether your ...很难确定您的LSTM模型在序列预测问题上是否表现良好。 You may be getting a good model skill score, but it is important to know whether your model
基于pytorch的LSTM模型训练与预测（附源码）
2024-06-14 15:37

LiyC;的博客关于这个模型的基本概念可以查看这篇文章，写得很详细，我觉得能大概看明白反向传递各个部分的推导就行了。
PyTorch LSTM模型训练与应用实战
2024-09-18 12:21

鸟看世界的博客简介：这个项目提供了使用PyTorch框架训练LSTM网络的全流程源代码，包括数据预处理、模型定义、训练循环、超参数设置、模型保存与加载，以及可能的性能评估和可视化。SalemML库的使用表明这可能是一个辅助深度学习...
CNN-LSTM模型训练及预测瓦斯浓度
2024-03-05 16:41

NURBS.的博客提取所需列存入新的文件，去除异常值的同时也保留了所需要的含有时间序列和空间序列的数据，再对含有时间序列和空间序列的数据进行处理以及设置瓦斯浓度为标签数据，然后对数据进行了分类，包括训练集，验证集以及...
模型训练时的过拟合
2025-03-21 10:48

_painter的博客 ‌过拟合‌是机器学习模型在训练过程中出现的一种现象，指模型在训练数据上表现极好，但在未见过的新数据（测试数据或真实场景）上表现显著下降。简单来说，模型“死记硬背”了训练数据中的细节和噪声，导致失去泛化...
模型过拟合是什么?
2025-05-11 23:29

魔王阿卡纳兹的博客 过拟合是模型能力与数据规律不匹配的典型表现，解决核心在于平衡模型复杂性与数据信息量。通过正则化、数据增强及训练策略优化，可有效提升泛化性能。实践中需结合具体场景选择方法，例如小数据场景优先采用正则化，...
【模型优化】增加数据量解决模型过拟合问题
2023-10-30 17:28

王摇摆的博客监控验证集的性能，在验证集上性能不再提升时停止训练，以避免模型在训练数据上过拟合。使用 L1 或 L2 正则化来限制模型参数的大小，防止模型过分拟合训练数据。使用多个模型的组合，比如随机森林、梯度提升树等，...
基于LSTM模型的股票预测模型.zip
2025-03-02 22:23

在金融领域，尤其是股票市场预测，人工智能技术已经被广泛应用。其中，长短期记忆网络（Long Short-Term Memory, LSTM）作为一种递归神经网络（Recurrent Neural Network, RNN）的变体，因其在处理序列数据时能够...
AI人工智能领域LSTM：助力智能应用升级
2025-05-03 03:51

光子AI的博客随着人工智能技术的快速发展，序列数据处理需求日益增长，如自然语言、时间序列、语音信号等。传统循环神经网络（RNN）在处理长序列时面临梯度消失/爆炸问题，导致长期依赖信息难以捕捉。LSTM（Long Short-Term ...
如何评估LSTM模型的性能?
2025-03-11 22:28

学术乙方的博客如何评估LSTM模型的性能?
没有解决我的问题, 去提问

LSTM模型训练过拟合问题。

1条回答 默认 最新

1条回答默认最新