LSTM模型真实值与预测试存在较大误差，如何改进

已知每年各月对应的传染病感染人数，在运用LSTM对传染病进行预测时，训练集是2018年6月到2021年12月每个月感染人数的数据，测试集是2022年1月到2024年4月每个月感染人数的数据。对数据先后进行了一阶差分和归一化处理，结果显示测试集的预测值与真实值趋势相似，但是两者的误差非常大，想问问这是什么原因，该怎么解决？有哪些调整参数或者优化模型的方法？

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
from keras.layers import LSTM, Dense, Dropout
from keras.models import Sequential
from keras.regularizers import L2
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
import numpy as np
from keras.callbacks import EarlyStopping


# 数据的差分转换
def difference(data_set, interval=1):
    diff = list()
    for i in range(interval, len(data_set)):
        value = data_set[i] - data_set[i - interval]
        diff.append(value)
    return pd.Series(diff), data_set[0]


# 对预测的数据进行逆差分转换
def invert_difference(last_ob, yhat, interval=1):
    return yhat + last_ob


# 将数据转换为监督学习集，移位后产生的NaN值补0
def timeseries_to_supervised(data, lag=1):
    df = pd.DataFrame(data)
    columns = [df.shift(i) for i in range(1, lag + 1)]
    columns.append(df)
    df = pd.concat(columns, axis=1)
    df.fillna(0, inplace=True)
    return df


# 归一化处理将数据缩放到[-1,1]之间
def scale(train, test):
    scaler = MinMaxScaler(feature_range=(-1 , 1))
    scaler = scaler.fit(train)
    train_scaled = scaler.transform(train)
    test_scaled = scaler.transform(test)
    return scaler, train_scaled, test_scaled


# 将预测值进行逆缩放，使用之前训练好的缩放器，x为一维数组，y为实数
def invert_scale(scaler, X, y):
    new_row = [x for x in X] + [y]
    array = np.array(new_row)
    array = array.reshape(1, len(array))
    invert = scaler.inverse_transform(array)
    return invert[0, -1]


# 构建一个LSTM模型
def fit_lstm(train, batch_size, nb_epoch, neurons, dropout=0.2, reg_lambda=0.01):
    X, y = train[:, 0:-1], train[:, -1]
    X = X.reshape(X.shape[0], 1, X.shape[1])

    model = Sequential()
    model.add(LSTM(neurons, batch_input_shape=(batch_size, X.shape[1], X.shape[2]), stateful=True, return_sequences=True))
    model.add(Dropout(dropout))
    model.add(LSTM(neurons, stateful=True, return_sequences=True))
    model.add(Dropout(dropout))
    model.add(LSTM(neurons, stateful=True, kernel_regularizer=L2(reg_lambda)))  # 添加L2正则化
    model.add(Dropout(dropout))
    model.add(Dense(1))

    model.compile(loss='mean_squared_error', optimizer='RMSProp')

    # Early stopping适时停止训练
    early_stopping = EarlyStopping(monitor='loss', patience=0, verbose=1)

    for i in range(nb_epoch):
        model.fit(X, y, epochs=1, batch_size=batch_size, verbose=1, shuffle=False, callbacks=[early_stopping])
        model.reset_states()
    return model


# 开始单步预测
def forecast_lstm(model, batch_size, X):
    X = np.array(X)
    X = X.reshape(1, 1, len(X))
    yhat = model.predict(X, batch_size=batch_size)
    return yhat[0, 0]


# 读取数据
excel_file_path = r"D:\pyproject\LSTM\nums.xlsx"
data = pd.read_excel(excel_file_path, engine='openpyxl', parse_dates=['时间'])
print(data.columns)

# 将时间数据转换为字符串类型，并按照年月格式进行解析
data['时间'] = data['时间'].dt.strftime('%Y年%m月')
data['时间'] = pd.to_datetime(data['时间'])

# 将原数据转换为二维数组形式
raw_values = data['发病数'].values
# 将数据进行差分转换
diff_values, first_value = difference(raw_values, 1)
diff_values = diff_values.values

# 将序列形式的数据转换为监督学习集形式
supervised = timeseries_to_supervised(diff_values, 1)
supervised_values = supervised.values

# 将数据集分割为训练集和测试集
testNum = 25
train, test = supervised_values[:43], supervised_values[-testNum:]
# 将训练集和测试集都缩放到[-1,1]之间
scaler, train_scaled, test_scaled = scale(train, test)

# 构建一个LSTM模型并训练
lstm_model = fit_lstm(train_scaled, 1, 300, 10, 0.2, reg_lambda=0.01)


# 遍历测试集，对数据进行单步预测
predictions = list()
for i in range(len(test_scaled)):
    X, y = test_scaled[i, 0:-1], test_scaled[i, -1]
    yhat = forecast_lstm(lstm_model, 1, X)
    yhat = invert_scale(scaler, X, yhat)
    last_ob = raw_values[-len(test_scaled) + i - 1] if i > 0 else first_value
    yhat = invert_difference(last_ob, yhat, 1)
    predictions.append(yhat)

# 获取测试集的时间索引
test_index = data.index[-testNum:]
true_values = data['发病数'].tail(testNum).values

# 打印预测值和原始数据
print("\n预测值:", predictions)
print("原始数据（测试集）:", true_values)

# 计算评估指标
rmse = np.sqrt(mean_squared_error(true_values, predictions))
mae = mean_absolute_error(true_values, predictions)
r2 = r2_score(true_values, predictions)
print("Test RMSE:", rmse)
print("Test MAE:", mae)
print("Test R²:", r2)


#设置，使matplotlib能正常输出中文且符号显示不异常
import matplotlib
matplotlib.rc("font",family='SimSun')
plt.rcParams['axes.unicode_minus']=False
# 绘制预测值与实际值的图
plt.figure(figsize=(12, 6))
plt.plot(data.loc[test_index, '时间'], true_values, label='true')  # 使用时间作为横坐标
plt.plot(data.loc[test_index, '时间'], predictions, label='predict')  # 使用时间作为横坐标
plt.legend()
plt.title('附件二真实值与预测值对比')
plt.xlabel('time')
plt.ylabel('number')
plt.xticks(rotation=45)
plt.show()

# 检查预测值
print("预测值:", predictions)

以下是真实值和预测值的大小以及对比图
预测值: [55187.49152672291, -2051.1909727454176, 261.3303700089464, 9856.500291466713, 6470.358180373908, -87.71566048264413, -1116.5496807396403, 233.91898119449706, 2487.400110274554, 1839.2509351968774, -2154.191992402076, -1689.770840406417, -852.153939962386, 602.5681008100521, 5806.498772382737, 32219.26567184925, 48518.604459524155, 19874.70840358734, 13059.032410323622, 11653.124070167543, 3900.5170504450807, 1104.4910699129116, 106.93952131271476, -582.3792816400517, 223.9498740434658]
原始数据（测试集）: [ 3309 5276 14545 10833 3941 2570 3575 5487 4509 204 381 960
2188 7199 33454 49632 20900 14025 12586 4823 2036 1064 414 1271
8105]

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-05-18 14:58
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

您想要解决的问题

您希望解决的问题是LSTM模型在预测传染病感染人数时存在较大误差的问题。您想要了解误差产生的原因，并寻求改进模型预测精度的方法。

图片内容

图片显示了真实值与预测值的对比图。从图中可以看出，尽管预测值的趋势与真实值相似，但两者之间的误差较大。

问题出现原因

模型参数设置：可能是由于LSTM模型的参数设置（如神经元数量、批次大小、迭代次数、dropout率等）不够优化。
数据预处理：数据的一阶差分和归一化处理可能影响了模型的学习效果。
数据集划分：训练集和测试集的划分可能不够合理，导致模型泛化能力不足。
模型复杂度：模型可能过于简单或过于复杂，无法捕捉数据中的复杂模式。
正则化：L2正则化的应用可能影响了模型的学习能力。

问题解决方案

调整模型参数：尝试不同的神经元数量、批次大小、迭代次数和dropout率，以找到最优的模型配置。
改进数据预处理：考虑使用不同的数据预处理方法，如更复杂的差分或不同的归一化技术。
数据集重新划分：重新考虑训练集和测试集的划分，确保模型有足够的数据来学习和泛化。
增加模型复杂度：如果模型过于简单，可以尝试增加更多的LSTM层或神经元。
调整正则化策略：调整L2正则化的参数，或者尝试其他正则化方法，如dropout。
模型评估：使用更多的评估指标，如MAE、RMSE和R²，来全面评估模型性能。

提供代码

以下是一些修改建议，您可以根据这些建议调整您的代码：

# 调整LSTM模型参数 def fit_lstm(train, batch_size, nb_epoch, neurons, dropout=0.2, reg_lambda=0.01): # ... 省略其他代码 ... model.add(LSTM(neurons, batch_input_shape=(batch_size, X.shape[1], 1), stateful=True, return_sequences=True)) # 修改输入维度 # ... 省略其他代码 ... # 调整训练参数 model.compile(loss='mean_squared_error', optimizer='adam') # 尝试使用adam优化器 # 使用模型检查点和EarlyStopping from keras.callbacks import ModelCheckpoint checkpoint = ModelCheckpoint('best_model.h5', monitor='loss', verbose=1, save_best_only=True, mode='min') early_stopping = EarlyStopping(monitor='loss', patience=10, verbose=1, restore_best_weights=True) model.fit(X, y, epochs=nb_epoch, batch_size=batch_size, verbose=1, shuffle=False, callbacks=[early_stopping, checkpoint]) # ... 省略其他代码 ...

代码运行方式

确保您的环境中安装了Python、Keras、TensorFlow、Pandas、NumPy、Sklearn等库。
将上述代码保存为.py文件，并在具有上述库的环境中运行。

代码预期运行结果

预期结果是模型的预测精度会提高，误差会减小，预测值与真实值之间的差异会降低。

推荐相关链接

Keras官方文档
LSTM网络详解
深度学习优化技巧
正则化技术
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用 LSTM 模型进行时间序列预测的 Python 源码
2025-01-26 08:30

使用LSTM模型进行时间序列预测是深度学习领域...但随着Python编程语言和深度学习库的普及，使用LSTM模型进行时间序列预测的门槛已经大大降低，更多的人可以利用开源资源进行尝试和探索，从而推动相关技术的发展和应用。
LSTM与Transformer融合时序预测[可运行源码]
2025-11-13 06:42

该混合模型在短期时间序列预测上展现出了良好的性能，通过实验验证，模型的预测结果与真实值之间存在较高的相似度。此外，为了直观地展示模型预测的效果，作者还提供了预测结果与真实值的对比图以及误差分布图。...
基于VMD-SSA-LSTM的时间序列预测模型及其MATLAB实现
2025-04-07 22:22

最后，各IMF分量通过各自训练的LSTM模型进行预测，并将结果合并以获得最终预测值。文中提供了详细的MATLAB代码示例，涵盖VMD分解、SSA优化以及LSTM网络构建与训练等关键步骤。适用人群：适用于有一定MATLAB编程基础...
MATLAB实现LSTM多输出回归预测：从数据预处理到模型评估的一站式解决方案
2025-04-08 13:00

结果可视化部分不仅展示了预测与真实值的对比图，还包括多种误差分析图表。此外，文中还提供了详细的性能评估指标计算方法，如R²、MAE、MBE和RMSE等。适合人群：初学者和有一定编程基础的时间序列预测爱好者，尤其...
PSO-LSTM基于PSO优化LSTM网络的电力负荷预测（Python代码实现）
2025-11-08 06:23

然后，利用PSO算法初始化LSTM网络的参数，并在迭代过程中调整这些参数，以最小化预测误差。此外，代码实现部分涉及到电力系统仿真的其他领域，包括水声网络仿真、多微网主体电热共享策略、分布式电源选址定容优化...
基于LSTM-Adaboost的电力负荷预测（Matlab代码实现）
2025-10-26 20:35

文档不仅展示了模型构建、训练与测试全过程，还适用于其他时序预测场景，具有较强的实用性和扩展性基于LSTM-Adaboost的电力负荷预测（Matlab代码实现）。; 适合人群：具备一定Matlab编程基础和机器学习背景的高校...
基于BP神经网络与LSTM的股票价格预测项目源码及说明
2025-07-22 16:16

本项目通过将BP神经网络与LSTM相结合，构建了一个能够学习并预测股票价格变动的深度学习模型。它不仅为学习者提供了宝贵的实践机会，也展示了如何将理论知识应用于解决实际问题中。同时，这个项目也提醒我们，尽管...
ARIMA模型与LSTM模型在气候数据时间序列预测中的比较研究
2024-05-12 17:20

..️..的博客本文采用LSTM模型和ARIMA模型对时间序列数据进行预测，通过绘制拟合图、计算均方误差等指标对模型进行评价。
基于LSTM的贵州茅台股票价格走势分析及预测模型研究【股票可换】
2024-07-27 16:54

王小王-123的博客本研究聚焦于利用长短期记忆网络（LSTM）构建贵州茅台股票价格趋势的分析和预测模型。随着金融市场日益复杂化，传统股价预测方法在处理非线性时间序列数据方面遇到了诸多障碍。为应对这一挑战，我们选择了LSTM这一...
【预测模型】基于LSTM神经网络的股票预测附Python+pytorch代码
2025-04-01 14:34

Matlab前程算法屋的博客股票市场以其高收益性与高风险性并存的特点，长期以来吸引着大量投资者。...传统的预测方法往往难以捕捉这些因素之间的非线性关系，导致预测精度较低。近年来，深度学习技术在处理时间序列数据方面展现出强大的能力。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月18日

LSTM模型真实值与预测试存在较大误差，如何改进

2条回答 默认 最新

您想要解决的问题

图片内容

问题出现原因

问题解决方案

提供代码

代码运行方式

代码预期运行结果

推荐相关链接

问题事件

2条回答默认最新