对于LSTM实践问题的疑问

最近想跑一个简单的LSTM的模型，但是预测结果总是很差，不知道问题处在了哪里？

import yfinance as yf
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
from datetime import datetime

# 获取股票数据
df = yf.download('AAPL', start='2012-01-01', end=datetime.now().strftime('%Y-%m-%d'))

# 选择特征：Open, High, Low, Close, Volume
data = df[['Open', 'High', 'Low', 'Close', 'Volume']]

# 计算移动平均线（如5日、10日、20日）
data['MA5'] = data['Close'].rolling(window=5).mean()
data['MA10'] = data['Close'].rolling(window=10).mean()
data['MA20'] = data['Close'].rolling(window=20).mean()

# 计算指数平滑移动平均线（EMA）
data['EMA'] = data['Close'].ewm(span=20, adjust=False).mean()

# 计算相对强弱指数（RSI）
delta = data['Close'].diff(1)
gain = delta.where(delta > 0, 0)
loss = -delta.where(delta < 0, 0)
avg_gain = gain.rolling(window=14).mean()
avg_loss = loss.rolling(window=14).mean()
rs = avg_gain / avg_loss
data['RSI'] = 100 - (100 / (1 + rs))

# 移除缺失值
data.dropna(inplace=True)

# 数据归一化
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_data = scaler.fit_transform(data)

# 定义窗口大小
look_back = 60

# 创建特征和目标
x_data = []
y_data = []
for i in range(look_back, len(scaled_data)):
    x_data.append(scaled_data[i-look_back:i])
    y_data.append(scaled_data[i, 3])  # 目标是收盘价

# 转换为numpy数组
x_data, y_data = np.array(x_data), np.array(y_data)

# 划分训练和测试数据
train_size = int(len(x_data) * 0.8)
x_train, x_test = x_data[:train_size], x_data[train_size:]
y_train, y_test = y_data[:train_size], y_data[train_size:]

# 重塑数据为LSTM的输入形状
x_train = np.reshape(x_train, (x_train.shape[0], x_train.shape[1], x_train.shape[2]))
x_test = np.reshape(x_test, (x_test.shape[0], x_test.shape[1], x_test.shape[2]))

import torch
from torch.utils.data import DataLoader, Dataset

class StockDataset(Dataset):
    def __init__(self, features, targets):
        self.features = features
        self.targets = targets

    def __len__(self):
        return len(self.features)

    def __getitem__(self, index):
        return self.features[index], self.targets[index]

train_dataset = StockDataset(x_train, y_train)
train_loader = DataLoader(train_dataset, batch_size=16, shuffle=True)

test_dataset = StockDataset(x_test, y_test)
test_loader = DataLoader(test_dataset, batch_size=16, shuffle=False)

import torch.nn as nn

class LSTMModel(nn.Module):
    def __init__(self, input_size, hidden_size1=128, hidden_size2=64, output_size=1):
        super(LSTMModel, self).__init__()
        self.lstm1 = nn.LSTM(input_size, hidden_size1, num_layers=1, batch_first=True)
        self.lstm2 = nn.LSTM(hidden_size1, hidden_size2, num_layers=1, batch_first=True)
        self.dense = nn.Linear(hidden_size2, output_size)

    def forward(self, x):
        lstm_out1, _ = self.lstm1(x)
        lstm_out2, _ = self.lstm2(lstm_out1)
        lstm_out2 = lstm_out2[:, -1, :]  # 只取最后一个时间步的输出
        predictions = self.dense(lstm_out2)
        return predictions

input_size = x_train.shape[2]
model = LSTMModel(input_size=input_size)

import torch.optim as optim

def train_model(model, train_loader, num_epochs=100, lr=0.001):
    loss_function = nn.MSELoss()
    optimizer = optim.Adam(model.parameters(), lr=lr)
    
    for epoch in range(num_epochs):
        model.train()
        for inputs, targets in train_loader:
            inputs, targets = inputs.float(), targets.float()
            optimizer.zero_grad()
            outputs = model(inputs)
            loss = loss_function(outputs, targets)
            loss.backward()
            optimizer.step()
        print(f'Epoch {epoch+1}/{num_epochs}, Loss: {loss.item()}')

train_model(model, train_loader)

model.eval()
predictions = []

with torch.no_grad():
    for inputs, _ in test_loader:
        inputs = inputs.float()
        outputs = model(inputs)
        predictions.append(outputs.numpy())

# 连接预测结果
predictions = np.concatenate(predictions)

# 反归一化
predictions = scaler.inverse_transform(np.concatenate((np.zeros((predictions.shape[0], scaled_data.shape[1] - 1)), predictions.reshape(-1, 1)), axis=1))[:, -1]

# 可视化
train = data.iloc[:train_size + look_back]
valid = data.iloc[train_size + look_back:]
valid['Predictions'] = predictions

plt.figure(figsize=(16,8))
plt.title('Model')
plt.xlabel('Date')
plt.ylabel('Close Price USD ($)')
plt.plot(train['Close'])
plt.plot(valid[['Close', 'Predictions']])
plt.legend(['Train', 'Val', 'Predictions'], loc='lower right')
plt.show()

结果很差：

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

30条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-07-12 15:57
关注
获得0.50元问题酬金
引自免费微信小程序：皆我百晓生

你的代码看起来大体上没有问题，但有几个可能的原因导致预测结果不佳：

数据问题：你可能需要更多的数据，特别是更多的近期数据，以提高模型的预测能力。股票市场受到许多复杂因素的影响，因此更多的数据可以让模型更好地捕捉这些因素的影响。另外，你需要检查你的数据是否确实包含了你预期的所有特征，例如市场趋势、季节性变化等。对于股票价格预测来说，一些宏观经济因素如政策变化、全球经济形势等也可能产生影响，这些因素在你的当前数据中可能没有体现。
模型结构问题：你的模型可能过于简单或过于复杂。尝试调整LSTM层的数量和隐藏层的大小，看看是否可以改善结果。此外，你也可以尝试添加更多的预处理步骤或特征工程步骤，例如添加更多的技术指标或统计特征。此外，考虑使用更复杂的模型结构，如使用注意力机制或者结合其他机器学习算法。
训练问题：你可能需要更长时间的训练或者更多的训练周期。深度学习模型的训练通常需要大量的时间和计算资源。你可以尝试增加训练的epoch数量或者调整学习率来看看是否能提高模型的性能。此外，确保你的训练过程没有出现过早停止或者欠拟合的情况。
归一化和反归一化问题：你的归一化和反归一化步骤看起来是正确的，但请确保你的测试数据和训练数据使用的归一化参数是一致的。如果测试数据的归一化参数和训练数据的参数不一致，可能会导致预测结果不准确。另外，确保你在反归一化预测结果时使用的是正确的列索引（在你的代码中看起来是scaled_data.shape[1] - 1）。这是因为你的模型是在预测收盘价（Close），所以你需要从归一化的数据中提取相应的部分进行反归一化。如果这一步出现问题，可能会导致预测结果与实际结果有较大偏差。

希望这些建议对你有所帮助！如果还有其他问题，请继续提问。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

无编程基础如何学习LSTM lstm rnn 神经网络
2022-01-27 14:51

回答 1 已采纳 1、因为未接触编程，所以有必要掌握至少一门编程语言。考虑到从事AI相关研究，建议学习Python，其次是C++；2、学习Pytorch框架，其有Python和C++接口，根据你学习的语言决定；3、学习
关于LSTM预测的问题 lstm matlab 算法
2023-02-21 20:29

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这篇博客也许可以解决你的问题👉 ：LSTM如何解决梯度消失与梯度爆炸如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相
深度学习LSTM的参数问题 lstm 深度学习神经网络
2023-03-07 11:00

回答 4 已采纳参考GPT和自己的思路，LSTM的参数W、U、b可以通过随机初始化或者预训练的方式获得。一般来说，W、U、b的维度和对应的输入和输出维度相关。在你给出的LSTM结构中，输入xt的大小是100，ht的
大语言模型原理与工程实践：大语言模型训练综述
2024-05-25 02:09

光剑书架上的书的博客大语言模型原理与工程实践：大语言模型训练综述作者：禅与计算机程序设计艺术 1. 背景介绍 1.1 大语言模型的兴起近年来，随着深度学习技术的飞速发展以及互联网上文本数据的爆炸式增长，自然语言处理（NLP）领域
lstm时间序列预测过拟合问题 lstm python 有问必答
2021-09-16 20:21

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
LSTM中关于数据匹配的问题 lstm python
2023-03-23 16:59

回答 8 已采纳基于Monster 组和GPT的调写：用LSTM模型来实现时间序列数据的相似度匹配 import numpy as np from keras.models import Sequential fr
如何使用LSTM和Transform等经典模型 lstm transformer 自然语言处理
2022-10-12 20:31

回答 1 已采纳建议换pytorch，信我，tensorflow坑巨多，还有各个版本之间的api兼容性，cuda兼容性巨差，旧版本的代码（1.08-1.15）在新版本（2.x）基本上跑不动,而一些旧的代码基本上都是1
【LangChain编程：从入门到实践】聊天模型
2024-07-31 05:58

AI大模型应用之禅的博客【LangChain编程：从入门到实践】聊天模型作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词：LangChain, 聊天模型, 生成式对话, 大型语言模型, NLP, 自然语言处理 1
LSTM输入数据格式问题 batch lstm
2018-11-05 07:36

回答 2 已采纳 model.add(LSTM(50, input_shape=(train_x1.shape[1], train_x1.shape[2]))) -> model.add(LSTM(50, i
关于#LSTM#的问题，如何解决？ lstm 机器学习
2023-03-17 11:20

回答 5 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：根据您提供的代码，可以发现训练出来的 LSTM 模型在预测时的表现并不理想。在分析时需要注意以下几点：数据归一化由于 LSTM 模型的特点，输入
关于#lstm#的问题：lstm训练，padding 补0后,模型不收敛 lstm pytorch 时序数据库
2022-07-20 18:43

回答 2 已采纳直接划分60s滑动窗口不行嘛
【一起入门NLP】中科院自然语言处理作业三：用BiLSTM+CRF实现中文命名实体识别（TensorFlow入门）【代码+报告】
2021-11-29 00:23

vector<>的博客下图是test()主要的调用过程：比较特殊的是，并没有直接用python代码来计算准确率，而是利用一个基于perl(一种编程语言)的工具conlleval_rev.pl。在eval.py中执行下面这句代码就能调用conlleval_rev.pl工具。 ...
pytorch搭建的cnn-lstm的Tensor问题 cnn python pytorch
2022-10-19 08:47

回答 1 已采纳你看下这篇博客吧, 应该有用👉 ：pytorch+cnn+lstm+词向量
自然语言处理（NLP）一直是人工智能领域的一项重要任务，其涉及到从文本中提取特征、组织数据、训练模型等诸多复杂任务。如何有效地进行文本理解和分析?
2023-07-31 01:13

光剑书架上的书的博客自然语言处理（NLP）一直是人工智能领域的一项重要任务，其涉及到从文本中提取特征、组织数据、训练模型等诸多复杂任务。如何有效地进行文本理解和分析，成为一个重要研究课题。近年来，随着计算能力的提升和硬件...
自然语言交互与对话系统原理与代码实战案例讲解
2024-07-03 00:26

光剑书架上的书的博客对话系统的核心算法涉及自然语言理解、对话策略规划、对话流管理、对话生成等多个层面。常用的算法包括基于规则的方法、基于统计的方法、基于深度学习的方法等。多模态融合：结合视觉、听觉等信息，提升交互效果。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月12日

悬赏问题

¥15 Windows Script Host 无法找到脚本文件"C:\ProgramData\Player800\Cotrl.vbs”
¥15 matlab自定义损失函数
¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图

对于LSTM实践问题的疑问

30条回答 默认 最新

问题事件

悬赏问题

30条回答默认最新