LSTM预测结果是一条直线

我使用pytorch的LSTM模型预测单变量时，训练集上的loss几乎不下降，验证集的loss每个epoch都一样，最后的预测结果也是呈现一条曲线，但是我找不到问题在哪，loss曲线、预测拟合和代码如下：


import numpy as np
import pandas as pd
import torch
import torch.nn as nn
from torch.utils.data import DataLoader, Dataset
from sklearn.metrics import mean_absolute_error, mean_squared_error
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler, StandardScaler

plt.rcParams['font.sans-serif'] = ['SimHei'] # 解决汉字显示为指定默认字体为黑体
plt.rcParams['axes.unicode_minus'] = False

#加载文件
file = "D:\\Files\\Jupyter Files\\dataSet\\merged_data.csv"
data = pd.read_csv(file)

#参数设置
input_window = 12
output_window = 12
batch_size = 32
train_ratio = 0.6  # 60% 用于训练
val_ratio = 0.2
test_ratio = 0.2
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# 数据集定义
class TrafficDataset(Dataset):
    def __init__(self, data, input_window, output_window):
        self.data = data
        self.input_window = input_window
        self.output_window = output_window

    def __len__(self):
        return len(self.data) - self.input_window - self.output_window + 1

    def __getitem__(self, idx):
        x = self.data[idx:idx + self.input_window]
        y = self.data[idx + self.input_window:idx + self.input_window + self.output_window]
        return torch.tensor(x, dtype=torch.float32).to(device), torch.tensor(y, dtype=torch.float32).to(device)

# 数据划分
traffic_data = data['traffic'].values
train_size = int(len(traffic_data) * train_ratio)
val_size = int(val_ratio * len(traffic_data))
test_size = len(traffic_data) - train_size - val_size
train_data = traffic_data[:train_size]
val_data = traffic_data[train_size:train_size+val_size]
test_data = traffic_data[train_size+val_size:]

#数据归一化
scaler = MinMaxScaler(feature_range=(0, 1))
train_data = scaler.fit_transform(train_data.reshape(-1, 1))
val_data = scaler.transform(val_data.reshape(-1, 1))
test_data = scaler.transform(test_data.reshape(-1, 1))

train_dataset = TrafficDataset(train_data.reshape(-1), input_window, output_window)
val_dataset = TrafficDataset(val_data.reshape(-1), input_window, output_window)
test_dataset = TrafficDataset(test_data.reshape(-1), input_window, output_window)

train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=batch_size, shuffle=False)
test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)

# LSTM 模型定义
class LSTMPredictor(nn.Module):
    def __init__(self, input_dim=1, hidden_dim=32, output_dim=1, num_layers=2):
        super(LSTMPredictor, self).__init__()
        self.num_layers = num_layers
        self.hidden_dim = hidden_dim
        self.lstm = nn.LSTM(input_dim, hidden_dim, num_layers, batch_first=True)
        self.linear1 = nn.Linear(hidden_dim, hidden_dim)
        self.relu = nn.ReLU()
        self.linear2 = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_dim)
        c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_dim)
        lstm_out, _ = self.lstm(x, (h0, c0))
        output = self.linear2(self.relu(self.linear1(lstm_out[:,-1,:])))
        return output

model = LSTMPredictor(input_dim=1, hidden_dim=64, output_dim=output_window).to(device)
criterion = nn.L1Loss()  #MAE
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

# 训练和验证
train_loss, val_loss = [], []

for epoch in range(10):
    model.train()
    running_loss = 0.0
    for x, y in train_loader:
        x = x.unsqueeze(-1)

        optimizer.zero_grad()
        output = model(x)

        # 反归一化预测和真实值
        output_denorm = scaler.inverse_transform(output.detach().numpy())
        y_denorm = scaler.inverse_transform(y.detach().numpy())

        # 转换回 PyTorch 张量，确保计算损失时不带梯度追踪
        # 计算反归一化后的损失
        loss = criterion(torch.tensor(output_denorm, requires_grad=True), torch.tensor(y_denorm, requires_grad=True))
        # loss = criterion(output, y)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()

    train_loss.append(running_loss / len(train_loader))

    # 验证
    model.eval()
    val_running_loss = 0.0
    with torch.no_grad():
        for x, y in val_loader:
            x = x.unsqueeze(-1)
            output = model(x)

            # 反归一化预测和真实值
            output_denorm = scaler.inverse_transform(output.detach().numpy())
            y_denorm = scaler.inverse_transform(y.detach().numpy())

            # 转换为无梯度的 PyTorch 张量
            loss = criterion(torch.tensor(output_denorm), torch.tensor(y_denorm))
            # loss = criterion(output, y)
            val_running_loss += loss.item()

    val_loss.append(val_running_loss / len(val_loader))
    print(f'Epoch {epoch + 1}, Train Loss: {train_loss[-1]:.4f}, Val Loss: {val_loss[-1]:.4f}')

# 训练和验证集上的损失曲线
plt.figure(figsize=(10, 5))
plt.plot(train_loss, label='Train Loss (MAE)')
plt.plot(val_loss, label='Validation Loss (MAE)')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.title('Training and Validation Loss')
plt.legend()
plt.show()

predictions, actuals = [], []

model.eval()
with torch.no_grad():
    for x, y in test_loader:
        x = x.unsqueeze(-1)
        output = model(x)
        predictions.append(output.detach().numpy())
        actuals.append(y.detach().numpy())

pred = np.concatenate(predictions, axis=0)
real = np.concatenate(actuals, axis=0)
# 反归一化
preds = scaler.inverse_transform(pred)
reals = scaler.inverse_transform(real)

# 计算评估指标
mae = mean_absolute_error(reals, preds)
rmse = np.sqrt(mean_squared_error(reals, preds))
mape = np.mean(np.abs((np.array(reals) - np.array(preds)) / np.array(reals))) * 100
print(f'MAE: {mae:.4f}, RMSE: {rmse:.4f}, MAPE: {mape:.4f}%')

# 预测结果拟合图
plt.figure(figsize=(10, 5))
plt.plot(np.array(reals)[:,0], label='real')
plt.plot(np.array(preds)[:,0], label='pred')
plt.xlabel('Time Step')
plt.ylabel('Traffic')
plt.title('Actual vs Predicted Traffic')
plt.legend()
plt.show()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

25条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-11-04 14:45
关注
获得0.60元问题酬金

以下回复引自免费微信小程序：皆我百晓生。如问题解决，还请采纳。如仍有疑问，请回复留言或私信博主，以便获得更精准的帮助。

为了找到可能的问题所在，首先需要检查LSTM模型的参数设置是否正确。通常情况下，LSTM模型的输入层、隐藏层以及输出层的大小应该与其输入数据的维度相匹配，而每个层的激活函数（例如TANH、RELU等）也应与当前层对应的输出层相同。

其次，检查训练集上的损失函数是否过低。LSTM模型在训练过程中会尝试最大化其输出层的预测概率，以达到最优解。如果损失函数过高或过于敏感，可能会导致模型无法收敛到最佳状态。

最后，考虑是否有其他因素影响了模型的性能，比如数据量、模型复杂度、训练时间等等。可以尝试调整这些参数值来找出最合适的模型结构和参数设置。

对于具体的代码示例，我建议参考官方文档或者参考相关的开源库，因为它们通常提供了详细的代码示例和教程。你可以查阅TENSORFLOW的LSTM模块，也可以查看PYTORCH的LSTM模块，从中获取有关如何构建和优化LSTM模型的详细指南。此外，你还可以查阅一些在线课程或者博客文章，了解实际操作过程中的常见问题和解决方法。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

LSTM预测结果是一条直线，如何解决？
2024-11-29 09:05

bug菌¹的博客调整LSTM模型的输出，确保只使用最后的时间步输出进行预测。检查学习率，尝试减小学习率，或者使用学习率调度器。确保评估时反归一化，避免训练过程中的反归一化对结果的影响。这些修改可以帮助你的模型更好地拟合...
使用LSTM预测结果为一条直线原因总结
2023-01-17 21:19

海洋之心的博客使用LSTM预测结果为一条直线原因总结
lstm预测一条直线_代码详解：以股票预测为例，揭秘时间序列预测
2020-12-17 13:08

射命丸咲的博客全文共4109字，预计学习时长8分钟从在线API中提取股票价格数据，使用配备有TensorFlow.js框架的递归神经网络和长期短期记忆（LSTM）执行预测。机器学习近年来深受欢迎，越来越多的人把它当作一个能够预测未来时间和...
svr预测出来是一条直线_人工智能制造业应用-装备寿命预测管理-自动化机床刀具寿命管理...
2020-12-13 12:30

weixin_39576336的博客 Background卷积神经网络与刀具崩刃检测实验电流信号如何反映刀具磨损卷积网络架构数据超参数网络架构图实验结果刀具寿命预测数据概况和预测目标特征和分析模型架构 LSTM+时域统计特征 LSTM+原始信号 LSTM+...
时间序列数据预测结果为一条直线原因总结
2023-01-17 21:17

海洋之心的博客时间序列数据预测结果为一条直线原因总结
网络输出为一条直线
2022-06-28 20:23

weixin_54727055的博客在用LSTM进行序列预测时出现网络输出为直线（在用ResNet和CNN中没有出现这种情况，可能是LSTM对输入要求比较高）问题原因是归一化！！！将数据进行归一化后网络输出正常！！PS：需要注意的是不能简单将数据集归一化...
LSTM时间序列预测中的一个常见错误以及如何修正
2024-05-06 10:14

deephub的博客结果虽然不是很满意，但是我们看到了代码已经预测了一些上升的趋势，要比前面的一条直线好一些，但是这里LSTM将所有时间步长聚合到特征中，所有这些方法都会丢失时间数据，所以在后面将介绍(编码器/解码器方法)来...
基于pytorch的LSTM模型训练与预测（附源码）
2024-06-14 15:37

LiyC;的博客具体过程可以参考这篇文章安装PyTorch详细过程_pytorch安装-CSDN博客 3.LSTM训练（下载链接）本文只是简略的一个训练和预测过程，适合感兴趣的人初步学习。所有代码都已经写有详细的注释，希望对读者的阅读能有帮助...
泰迪杯数据挖掘第十届B题，时间序列预测
2022-12-20 18:07

特立独行的蜗牛的博客我用到了ARIMA但是，由于预测过长，arima预测后期直接成一条直线了，我搜了很多资料，说是因为季节性或者说是周期性的问题，而模型无法识别是哪种周期性的特征（是以天、周还是月的），所以呈现直线。所以之后采用...
利用LSTM进行回归预测
2024-06-06 13:03

一条小鲤余的博客 LSTM在序列预测、文本生成、语音识别、时间序列分析等领域表现出色，并且由于其优秀的长序列处理能力，它在深度学习领域得到了广泛的应用。: 输入门由两个部分组成：一个sigmoid层决定哪些值将被更新，一个tanh层...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月4日

LSTM预测结果是一条直线

25条回答 默认 最新

问题事件

25条回答默认最新