tensorflow.keras训练模型预测问题

请问在使用tensorflow.keras训练模型预测时val_loss变化非常奇怪
loss是正常下降，但val_loss一开始就很低，而且一直震荡
如下图

最后预测结果也很差，如下图

我训练的模型如下
Xtrain.shape, Xtest.shape, Ytrain.shape, Ytest.shape为(2036, 60, 6) (400, 60, 6) (2036, 60, 6) (400, 60, 6)

model = keras.models.Sequential()
model.add(keras.layers.LSTM(40, input_shape=(Xtrain.shape[1:]), return_sequences=True, ))
model.add(keras.layers.Dropout(0.1))
model.add(keras.layers.LSTM(30, return_sequences=True))  # model.add(keras.layers.Dropout(0.5))
model.add(keras.layers.Dropout(0.1))
model.add(keras.layers.LSTM(40, return_sequences=True))
model.add(keras.layers.Dropout(0.1))
model.add(keras.layers.LSTM(40, return_sequences=True))
model.add(keras.layers.BatchNormalization())  # 批标准化：对一小批数据（batch）做标准化处理（使数据符合均值为0，标准差为1分布）
model.add(keras.layers.TimeDistributed(keras.layers.Dense(Ytrain.shape[2])))
model.compile(optimizer=keras.optimizers.Adam(lr=0.0001, amsgrad=True), loss='mse')  # mae: mean_absolute_error
model.summary()
history = model.fit(
        Xtrain, Ytrain,
        validation_data=(Xtest, Ytest),
        batch_size=32,
        epochs=30,
        verbose=1)

预测部分代码如下

predict = model.predict(Xtest)
predict = scalar.inverse_transform(predict[0])
Ytesting = scalar.inverse_transform(Ytest[0])
for i in range(6):
    plt.subplot(2, 3, i + 1)
    plt.plot(predict[:, i], color='blue')
    plt.plot(Ytesting[:, i], color='red')
plt.show()

请问是模型结构问题还是模型参数问题啊，亦或者训练模型的数据集有问题啊

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Roaring Kitty 人工智能领域优质创作者 2023-03-04 12:20
关注
这种情况可能是由于模型在训练过程中出现了过拟合的现象。过拟合通常是指模型在训练集上表现很好，但在测试集上表现不佳的情况。在训练过程中，模型过度适应了训练集的噪声和特定的样本，从而导致了 val_loss 震荡。

要解决这个问题，可以尝试以下几种方法：

增加训练数据量：通过增加训练数据量，可以减少模型的过拟合现象。

添加正则化项：在模型中添加正则化项，如 L1 或 L2 正则化，可以限制模型的复杂度，减少过拟合现象。

使用早期停止技术：在训练过程中，可以通过监控验证集上的 loss 值来确定模型是否开始出现过拟合。一旦发现过拟合现象，就可以通过早期停止来防止模型继续训练。

减小模型复杂度：通过减小模型的复杂度，如减少层数、神经元数等，可以降低过拟合现象的发生概率。

希望以上方法可以帮助您解决问题。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

tensorflow.keras训练预测模型输出一直都是直线 keras python tensorflow
2023-03-06 22:21

回答 3 已采纳可能是因为模型训练不充分或者数据集不够多造成的，可以尝试增加训练次数或者增加数据集来提高模型的准确性。同时，也可以检查一下模型的结构和参数是否设置合理。
tensorflow.keras打开SGD的问题，如何解决？ keras python tensorflow 有问必答
2022-03-19 21:27

回答 3 已采纳是不是安装的模块版本不对
module 'tensorflow.keras.layers' has no attribute 'Normalization keras tensorflow 深度学习
2022-08-09 16:15

回答 2 已采纳你是tensorflow哪个版本？keras哪个版本？不说版本很难查问题。可以试下把Normalization改为normalization试下可以试下把tensorflow.keras.layers
tensorflow及其keras如何保存模型
2023-05-28 07:30

爱编程的喵喵的博客本文主要介绍tensorflow及其keras保存并加载模型的...1. keras模型保存概述 2. TensorFlow SavedModel 格式 2.1 使用高级API：tf.keras.models.save_model 2.2 使用低级API：tf.saved_model.save 3. keras HDF5格式
tensorflow.keras训练问题 keras python tensorflow
2023-03-05 18:39

回答 2 已采纳尝试一下调整参数吧，或者加层数试试
tensorflow.keras训练周期所需时间增加 keras python tensorflow
2023-03-06 13:59

回答 2 已采纳这种情况有时也会遇到，可能是开的程序太多，后台程序对内存和磁盘资源的占用。
运行keras报错 No module named 'tensorflow.python.tools'; 'tensorflow.python' is not a package keras python tensorflow 有问必答
2021-09-10 14:14

回答 2 已采纳降低或升级tensorflow的版本试试，另外检查一下你这个文件名是不是tensorflow.
tensorflow.keras搭建神经网络六步法
2020-05-31 21:03

yunfeather的博客 tensorflow.keras搭建神经网络六步法第一步，import相关模块，如： import tensorflow as tf 第二步，指定输入网络的训练集和标签集，例如训练用的输入x_train和标签y_train,以及测试用的输入x_test和标签y_test...
import tensorflow.compat.v1 as tf报错 python tensorflow 有问必答
2021-05-06 18:20

回答 4 已采纳 scipy安装的有问题，导致内部引入的时候，无法识别相对路径。重装scipy conda remove --force scipy pip install scipy
请问tensorflow中的tf.keras.models.Model和tf.keras.Model有什么区别啊？ keras tensorflow 深度学习
2022-10-27 20:21

回答 2 已采纳没有看过源码，但是我的使用经验告诉我这两个是一样的，很有可能是同一个代码封装了两个入口。
做mnist识别时出现错误 AttributeError: module 'keras.api._v2.keras' has no attribute 'train' keras tensorflow 神经网络
2022-09-19 20:31

回答 1 已采纳现在用的是tf2吧，那应该要这样子写tf.keras.optimizers.Adam
Tensorflow2.x tf.keras.callbacks函数分析
2021-06-04 21:53

两只蜡笔的小新的博客 Tensorflow2.x callbacks函数分析前言新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右...
使用TensorFlow.js的AI聊天机器人：创建电影对话聊天机器人
2021-04-11 09:54

这个库提供了在JavaScript中加载、训练和应用机器学习模型的能力，使得Web开发者无需离开他们熟悉的编程环境就能实现AI功能。 **二、构建聊天机器人基础** 1. **数据预处理**：首先，我们需要收集和准备用于训练...
python导入keras_将Keras模型导入Tensorflow.js
2020-12-10 01:02

weixin_39673972的博客 Keras模型(通常通过Python API创建)可能被保存成多种格式之一. 整个模型格式可以被转换为Tensorflow.js的层(Layer)格式，这个格式可以被加载并直接用作Tensorflow.js的推断或是进一步的训练。转换后的TensorFlow.js...
tensorflow & keras 学习（官方文档）
2022-04-11 14:20

ERROR_LESS的博客 tensorflow learning 0 语句积累篇 # 查看是否启用eager execution，若启用则返回True tf.executing_eagerly() # 矩阵相乘 m = tf.matmul(x, x) # 矩阵对应位置元素相乘 c = np.multiply(a, b) # 创建常量 a = tf...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月4日

悬赏问题

¥15 PointNet++的onnx模型只能使用一次
¥20 西南科技大学数字信号处理
¥15 有两个非常“自以为是”烦人的问题急期待大家解决！
¥30 STM32 INMP441无法读取数据
¥15 R语言绘制密度图，一个密度曲线内fill不同颜色如何实现
¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
¥15 用visualstudio2022创建vue项目后无法启动
¥15 x趋于0时tanx-sinx极限可以拆开算吗
¥500 把面具戴到人脸上，请大家贡献智慧，别用大模型回答，大模型的答案没啥用
¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面，不要作在线的，要离线状态。

tensorflow.keras训练模型预测问题

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新