lstm loss值小，拟合效果差

python 做lstm loss值很小了，但拟合值和真实值相差很大，预测值是条直线，怎么调参啊？
下面是一些代码参数，调停、正则化、学习率、epoch都调过了,怎么修改能改变下预测效果啊？

def buildmylstm(initactivation="relu", ininlr=0.001):
    model = Sequential()
    nb_time_steps=train_x.shape[1]
    nb_input_vector=train_x.shape[2
    # 添加LSTM层
    model.add(Bidirectional(LSTM(units=64, input_shape=(nb_time_steps,nb_input_vector), 
                                 kernel_regularizer=keras.regularizers.l2(0.05),activation=initactivation)))
     # 添加BN层
    model.add(BatchNormalization())
    model.add(Dropout(0.01))
    # 添加全连接层
    model.add(Dense(units=1))
    
    # 编译模型
    lr=ininlr
    adam= optimizers.adam_v2.Adam(learning_rate=lr)
    def scheduler(epoch):##编写学习率变化函数
        ##每隔epoch,学习率减小为原来的1/10
        if epoch % 80==0 and  epoch !=0:
            lr=K.get_value(model.optimizer.lr)
            K.set_value(model.optimizer.lr,lr*0.01)
            print("lr changed to {}".format(lr*0.01))
        return K.get_value(model.optimizer.lr)
    model.compile(loss="mse",optimizer=adam,metrics=["mse"],run_eagerly=True)
    ##根据损失函数性质。回归建模一般选用“距离误差”作为损失函数，分类一般选“交叉熵”损失函数
     # 添加早停法回调
    early_stopping = EarlyStopping(monitor='val_loss', patience=15, verbose=1, mode='min')
    reduce_lr=LearningRateScheduler(scheduler)
    batchsize=int(len(all_data)/10)
    epochs=max(80,batchsize*3)
    history = model.fit(train_x,train_y, epochs=epochs,validation_data=(test_x, test_y), shuffle=False)
    plt.plot(history.history['loss'])
    plt.plot(history.history['val_loss'])
    plt.title('model train vs validation loss')
    plt.ylabel('loss')
    plt.xlabel('epoch')
    plt.legend(['train', 'validation'], loc='upper right')
    plt.show()
     # 在测试时去除dropout层的权重
    def set_dropout_trainable(layer, state):
        layer.trainable = state
    model.layers[-2].trainable = False  # 
设置Dropout层为不可训练
    return model

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
道友老李 JWE233286一种基于机器视觉的水表指针读数识别及修正的方法专利发明者 2025-01-15 10:46
关注
让【道友老李】来帮你解答，本回答参考gpt编写，并整理提供，如果还有疑问可以点击头像关注私信或评论(小黑屋了，无法评论，请私信)。
如果答案让您满意，请采纳、关注，非常感谢！
在你提供的代码中，可以尝试以下几种方法来改善模型的预测效果：
调整模型架构：尝试增加更多的LSTM层或者调整LSTM层的units参数，以增强模型学习能力。你可以尝试添加更多的LSTM层，并增加units参数的数量，可能会提升模型的表现。

model.add(Bidirectional(LSTM(units=128, input_shape=(nb_time_steps, nb_input_vector), kernel_regularizer=keras.regularizers.l2(0.05), activation=initactivation)))

调整学习率：尝试不同的学习率，可能当前的学习率不太适合你的数据集，导致模型收敛速度过快或者过慢。可以尝试增大学习率或者减小学习率来看看效果。

lr = ininlr * 0.1 adam = optimizers.adam_v2.Adam(learning_rate=lr)

使用更复杂的正则化方法：除了L2正则化之外，可以尝试使用L1正则化或者Dropout等方法来避免过拟合，可能会对模型的泛化能力有帮助。

model.add(Dropout(0.2))

增加更多的训练数据：如果可能的话，可以尝试增加更多的训练数据，以提高模型的泛化能力。请注意，调参是一个反复试验的过程，不能保证一次修改就能解决问题。建议对每一种调参方法逐一尝试，结合实际效果来进行调整。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

时序预测 | Python实现ARIMA-LSTM差分自回归移动平均模型结合长短期记忆神经网络时间序列预测
2024-09-12 17:25

机器学习之心的博客时序预测 | Python实现ARIMA-LSTM差分自回归移动平均模型结合长短期记忆神经网络时间序列预测
使用 Python 的 LSTM 进行股市预测
2024-04-08 09:26

无水先生的博客 LSTM 模型非常强大，尤其是在设计上保留长期记忆，正如您稍后将看到的。您将在本教程中解决以下主题：了解为什么您需要能够预测股价走势；下载数据 - 您将使用从雅虎财经收集的股票市场数据；分割训练测试数据并...
时间序列分析进阶：基于LSTM模型的趋势跟踪
2023-07-19 00:56

光子AI的博客时序数据处理（Time Series Data Analysis）是机器学习和数据科学领域的一个重要研究方向，它在许多应用场景中都有着广泛的应用。...本文将结合 LSTM (Long Short-Term Memory) 模型进行时序预测问题的实践。
从零开始实现 LSTM 神经网络——用 Python 实现 LSTM 神经网络训练及应用
2023-08-13 01:06

光子AI的博客因此，我们将从零开始构建一个LSTM神经网络，并用Python语言实践其训练和应用。本文将以最基本的案例——数字序列生成为例，一步步地教授读者如何搭建一个LSTM神经网络，并用该模型来生成数字序列。
人工智能发展史 — NLP 与 RNN/LSTM/Transformer/GPT 序列模型发展历程
2025-12-11 16:24

范桂飓的博客 2020年10月22日，Google团队发表An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale，提出了Vision Transformer（ViT），虽然不是第一篇将...引起了全球学术界和工业界的大语言模型热潮。
Bidirectional LSTMCRF for Sequence Labeling for 命名实体识别 NER
2023-08-09 03:38

光子AI的博客例如在 CoNLL-2003 NER 数据集上提出的 BiLSTM-CRF 模型[1]、Transformer 预训练模型[2]、BERT 预训练模型[3]等都取得了显著效果。近年来，随着 GPU/TPU 计算能力的增加，这些模型越来越容易训练。
提示词编程在自然语言讽刺检测中的角色
2024-12-26 03:32

光子AI的博客在当今信息时代，自然语言处理（NLP）技术正以惊人的速度发展，其应用范围也在不断扩展。自然语言讽刺检测，作为NLP的一个重要分支，近年来受到了广泛关注。讽刺作为一种特殊的语言现象，常用于表达讽
Python多层LSTM优化Seq2Seq序列模型预测社交网站用户签到时空轨迹数据
2025-06-11 04:37

拓端研究室TRL的博客通过均方根误差（RMSE）和决定系数（R²）评估模型表现：Seq2Seq模型的RMSE最低（0.086），R²达0.354，显著优于LSTM（RMSE=0.104，R²=0.228）和Transformer（RMSE=0.113，R²=-0.208）。清洗后的数据保存为CSV格式...
机器学习的核心算法原理并且介绍如何通过Python编程语言实现一个简单的神经网络模型
2023-08-07 00:56

光子AI的博客尤其是在一些复杂场景中，深度学习模型的效果更是超越人类的表现。在本文中，我们将从数据科学、机器学习、深度学习三个角度对这个热门的技术进行阐述。首先我们会回顾一下统计学习方法和监督学习方法的主要区别，...
C# 上位机智能升级：ML.NET+LSTM实现设备故障预测（振动数据实战）
2025-11-01 08:27

威哥说编程的博客 C#上位机结合ML.NET和LSTM实现故障预测，核心是**“数据预处理+模型集成+工业适配”**：通过提取振动数据的时域/频域特征，让LSTM模型学习故障模式，再通过ML.NET无缝集成到上位机，实现“实时采集→智能预测→故障...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月15日

lstm loss值小，拟合效果差

2条回答 默认 最新

问题事件

2条回答默认最新