GRU代码预测出错，结果很差

我写了一个GRU的时序模型预测的代码，当我通过30天的7个特征数据，预测第31天的7个维度数据。模型训练和预测的效果还可以。

但是当我开始利用滚动预测，也就是通过预测出来的31天的数据，填充进去再把第一天的数据剔除并预测，效果就开始差了。。

。具体的代码如下：不知道哪里有问题。

import torch
import torch.nn as nn
import numpy as np
import yfinance as yf
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from torch.utils.data import DataLoader, TensorDataset
import matplotlib.pyplot as plt
from datetime import datetime
import warnings

warnings.filterwarnings('ignore')

# 下载并预处理数据
def download_preprocess_data(ticker, start_date, end_date):
    data = yf.download(ticker, start=start_date, end=end_date)
    data = data[['Open', 'Close', 'Volume']]
    data['MA5'] = data['Close'].rolling(window=5).mean()
    data['MA10'] = data['Close'].rolling(window=10).mean()
    data['MA20'] = data['Close'].rolling(window=20).mean()
    data['EMA'] = data['Close'].ewm(span=20, adjust=False).mean()
    data.dropna(inplace=True)
    return data

def normalize_data(data):
    scaler = MinMaxScaler(feature_range=(0, 1))
    return scaler.fit_transform(data), scaler

def create_sequences(data, look_back):
    X, y = [], []
    max_index = len(data) - look_back
    for i in range(max_index):
        X.append(data[i:(i + look_back)])  # 特征窗口：从第i天到第i+look_back-1天
        y_target = data[i + look_back]  # 预测下一个时间步的所有7个特征
        y.append(y_target)
    return np.array(X, dtype=np.float32), np.array(y, dtype=np.float32)



data = download_preprocess_data('AAPL', '2014-01-01', datetime.now().strftime('%Y-%m-%d'))

# x_data, y_data = create_sequences(data.values, look_back = 30, steps_ahead=30)
scaled_data, scaler = normalize_data(data.values)
look_back = 30
x_data, y_data = create_sequences(scaled_data, look_back)

# Split data into train and test sets
train_size = int(len(x_data) * 0.8)
x_train, x_test = x_data[:train_size], x_data[train_size:]
y_train, y_test = y_data[:train_size], y_data[train_size:]
print("x_train shape:", x_train.shape)
print("y_train shape:", y_train.shape)
print("Data types:", x_train.dtype, y_train.dtype)
# Convert to PyTorch tensors
train_dataset = TensorDataset(torch.from_numpy(x_train).float(), torch.from_numpy(y_train).float())
train_loader = DataLoader(train_dataset, batch_size=16, shuffle=False)

# Define the GRU model
class GRUModel(nn.Module):
    def __init__(self, input_size, hidden_size1=256, hidden_size2=128, output_size=7):
        super(GRUModel, self).__init__()
        self.gru1 = nn.GRU(input_size, hidden_size1, num_layers=1, batch_first=True)
        self.gru2 = nn.GRU(hidden_size1, hidden_size2, num_layers=1, batch_first=True)
        self.dropout = nn.Dropout(0.2)
        self.dense = nn.Linear(hidden_size2, output_size)

    def forward(self, x):
        gru_out1, _ = self.gru1(x)
        gru_out1 = self.dropout(gru_out1)
        gru_out2, _ = self.gru2(gru_out1)
        gru_out2 = gru_out2[:, -1, :]  # 只取最后一个时间步的输出
        predictions = self.dense(gru_out2)
        return predictions

model = GRUModel(input_size=x_train.shape[2], hidden_size1=256, hidden_size2=128, output_size=7)
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.0001)

# Train the model
epochs = 1
for epoch in range(epochs):
    for inputs, targets in train_loader:
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, targets.unsqueeze(1))
        loss.backward()
        optimizer.step()
    print(f'Epoch {epoch+1}/{epochs}, Loss: {loss.item()}')

model.eval()

# 预测x_test的全部数据
with torch.no_grad():
    full_test_predictions = model(torch.from_numpy(x_test).float())  # 预测所有测试数据

# 准备滚动预测的初始输入：使用x_test的最后一个样本
last_inputs = x_test[-1]  # 这应该是一个[30, 7]的数组

# 使用模型进行初始预测
with torch.no_grad():
    last_inputs_tensor = torch.from_numpy(last_inputs).float().unsqueeze(0)  # 添加批次维度
    initial_prediction = model(last_inputs_tensor).numpy()

# 更新第30天的数据
current_input = np.vstack([last_inputs[1:], initial_prediction])  # 移除第一天，添加新预测的天

predicted_features = [initial_prediction.flatten()]  # 保存初始预测结果

# 滚动预测30次
for _ in range(30):
    with torch.no_grad():
        # 对当前输入进行预测
        current_input_tensor = torch.from_numpy(current_input[np.newaxis, :, :]).float()
        prediction = model(current_input_tensor).numpy()
        # 更新预测结果列表
        predicted_features.append(prediction.flatten())
        # 更新输入数据：移除第一个时间步，添加新的预测结果
        current_input = np.vstack([current_input[1:], prediction])

# 将预测结果转换为numpy数组
predicted_features = np.array(predicted_features)

print(predicted_features)

# 反归一化处理
full_predictions = np.zeros((predicted_features.shape[0], scaled_data.shape[1]))
full_predictions[:, 1] = predicted_features[:, 1]  # 取出Close价格特征
predictions_inv = scaler.inverse_transform(full_predictions)[:, 1]

# 准备绘图数据
start_date = data.index[train_size + look_back]
valid_dates = pd.date_range(start=start_date, periods=len(predicted_features), freq='D')

# 创建DataFrame
predictions_df = pd.DataFrame({
    'Predictions': predictions_inv,
    'Actual': data['Close'][train_size + look_back:train_size + look_back + len(predicted_features)].values
}, index=valid_dates)

# Visualization
plt.figure(figsize=(16, 8))
plt.title('Future Close Price Predictions Including Rolling Predictions')
plt.xlabel('Date')
plt.ylabel('Close Price USD ($)')

# 绘制预测结果和实际数据
plt.plot(predictions_df['Predictions'], label='Predicted Future Close', color='red', linestyle='--')
plt.plot(predictions_df['Actual'], label='Actual Close Price', color='blue', alpha=0.5)
plt.legend()
plt.show()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

24条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-08-28 17:53
关注
获得0.30元问题酬金
以下回复引自免费微信小程序：皆我百晓生。如问题解决，还请采纳。如仍有疑问，请回复留言或私信博主，以便获得更精准的帮助。

要解决这个问题，首先需要了解如何使用滚动预测在PYTHON中实现GRU模型，并且理解滚动预测的概念。滚动预测是一种特殊的GRU模型，它可以根据输入数据的变化来更新参数值，从而达到更好的预测效果。以下是一个基本的步骤：

1. 理解滚动预测

滚动预测（ROLLING GRADIENTS）是一种在GRU网络中的一种特殊形式，它允许在每次迭代中更新参数。滚动预测在GRU中起着关键作用，因为它可以帮助模型更好地适应输入变化的影响。

2. 使用滚动预测进行预测

例如，在一个GRU神经网络中，可以有多个GRUS分别对输入进行处理。每个GRU都有自己的权重和偏置，用于计算输出。滚动预测允许在每次迭代中更新这些权重和偏置，以确保在不同时间点上得到相似的结果。

3. 滚动预测的具体实现

滚动预测通常涉及以下几个步骤：

初始化：在每次迭代之前，根据输入数据调整模型的参数。
更新：在每次迭代后，从当前状态中减去前一次的状态，然后乘以一个滚动因子，即ROLLING_FACTOR。
求导：应用滚动因子来计算新的梯度，这个新梯度会随着滚动因子的增加而增长。

4. 在PYTHON中的滚动预测示例

假设我们有一个简单的GRU神经网络，其中包含三个GRUS，每个GRU都负责对输入进行不同的操作：

CLASS GRU(NN.MODULE): DEF __INIT__(SELF, INPUT_SIZE, HIDDEN_SIZE, OUTPUT_SIZE): SUPER(GRU, SELF).__INIT__() SELF.INPUT_SIZE = INPUT_SIZE SELF.HIDDEN_SIZE = HIDDEN_SIZE SELF.OUTPUT_SIZE = OUTPUT_SIZE # 初始化权重和偏置 SELF.GRU = NN.GRU(INPUT_SIZE, HIDDEN_SIZE) DEF FORWARD(SELF, X): # 进行前向传播 H_N, C_N = SELF.GRU(X) # 将隐藏状态和偏置添加到输出 RETURN H_N, (C_N,)

在这个例子中，INPUT_SIZE是输入的维度，HIDDEN_SIZE是每个GRU的输入维度，OUTPUT_SIZE是每个GRU的输出维度。

5. 测试滚动预测

现在我们可以测试滚动预测的实际效果了。假设我们的数据集已经准备好了，包括输入、输出以及一些标签信息。我们可以这样使用滚动预测：

DEF PREDICT(MODEL, DATA_LOADER, ROLLING_FACTOR=1): MODEL.EVAL() WITH TORCH.NO_GRAD(): FOR INPUTS, TARGETS IN DATA_LOADER: OUTPUTS, (H_N, C_N) = MODEL(INPUTS) IF ROLLING_FACTOR > 0: OUTPUTS = OUTPUTS * ROLLING_FACTOR # 对于每一个目标，计算期望输出 PREDICTIONS = [] FOR I IN RANGE(LEN(TARGETS)): PRED = OUTPUTS[I].ARGMAX(DIM=-1).ITEM() # 添加目标对应的预测结果到列表 PREDICTIONS.APPEND(PRED) # 更新滚动因子 ROLLING_FACTOR += 1 # 返回最近的预测 RETURN PREDICTIONS[-1] # 测试函数 IF __NAME__ == "__MAIN__": DEVICE = TORCH.DEVICE("CUDA" IF TORCH.CUDA.IS_AVAILABLE() ELSE "CPU") MODEL = GRU(64, 256, 1) MODEL.TO(DEVICE) DATA_LOADER = DATALOADER(TRAIN_DATASET, BATCH_SIZE=32, SHUFFLE=TRUE) ROLLING_FACTOR = 1 PRINT(F"STARTING PREDICTION ON ROLLING FACTOR {ROLLING_FACTOR}") PREDICTIONS = PREDICT(MODEL, DATA_LOADER, ROLLING_FACTOR)

这段代码展示了如何使用滚动预测在PYTHON中预测特定的时间步数。请注意，这只是一个基本的例子，实际的预测过程可能需要更复杂的逻辑和更多的细节。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

GRU代码中每层单元数如何设置 gru matlab
2023-03-03 15:23

回答 1 已采纳小魔女参考了bing和GPT部分内容调写:在GRU参数设置中，每层单元数的设置可以通过在GRU层之前添加Dense层来实现，具体代码如下： model = Sequential() model.add
GRU预测数据时为什么进行数据平铺 gru matlab
2023-03-03 15:30

回答 2 已采纳基于Monster 组和GPT的调写：使用GRU进行时间序列数据预测时，需要将数据进行平铺和格式转换，这是因为：平铺数据：GRU是一种循环神经网络，它在每个时间步上接收一个输入向量并输出一个隐藏状态
pso如何优化GRU gru matlab
2023-03-05 14:49

回答 1 已采纳我觉得是隐藏层数、隐藏单元数、迭代次数、学习率等超参作为pso的参数，当pso通过调整这些参数训练到模型最优时即到达全局最优点时保存的这些参数就是最后的超参。是到达最优状态下的这些超参数
《动手学深度学习》Seq2Seq代码可能出错的原因及适当分析
2022-02-07 17:23

琦子k的博客关于沐神《动手学深度学习》seq2seq代码可能出错的原因及分析
关于gru输入输出提取问题 gru python 深度学习
2023-04-21 15:50

回答 2 已采纳关于第一个问题，将输入的tensor由 [128,1,500] 转换为 [128,500,1] 并使用 nn.GRU(1, 128, 1, batch_first=True) 是正确的。因为在 bat
关于使用pytorch构建GRU python
2021-01-25 23:45

回答 8 已采纳具有batch_first = True [batch_size，seq_len，features]`的output张量。根据您的描述，我想您想使用上一步骤的激活进行分类，因此您可能希望通过以下方
encoder-decoder内，encoder层使用gru前的rnn或cnn是什么用？ python 人工智能机器学习
2021-05-24 22:51

回答 1 已采纳这个一般是根据任务特点而定的，不同的任务要根据这个任务的特点来选择网络结构。从你的问题描述，我猜测可能的情况是（以NLP任务为例）：1. 使用CNN对字向量进行卷积得到词向量，再将词向量输入到GRU中
融合卷积门控与实体边界预测的中文财务报表实体抽取研究
2024-07-28 17:54

罗思付之技术屋的博客在金融领域财务报表对企业的发展规划具有重要作用，但提取报表中的有效信息仍然高度依赖于人工。为此，提出一种融合关键信息和实体边界信息的财务报表命名实体识别方法，以提升财务报表有效信息提取效率。首先，通过...
哪位知道怎样将RNN模型替换为GRU或者LSTM python 神经网络自然语言处理
2022-12-09 10:02

回答 1 已采纳望采纳，要把 RNN 模型替换成 GRU 或 LSTM，那么需要把原来使用的 RNN 层换成 GRU 层或 LSTM 层。这个过程有以下几个注意点：替换层时，需要确保输入和输出的形状相同。例如，如果
关于#gru#的问题，如何解决？ c语言
2022-09-29 16:45

回答 1 已采纳 #include <stdio.h> int main(void) { int a,b,c,d; scanf("%d %d %d %d",&a,&b,&c,&d); if(c
keras模型网格搜索调参求助人工智能深度学习神经网络
2019-08-20 14:49

回答 1 已采纳 ![图片说明](https://img-ask.csdn.net/upload/201908/20/1566284267_172669.png)
自动驾驶轨迹预测论文阅读（一）Deep Learning-based Vehicle Behaviour Prediction For Autonomous Driving Applications
2022-07-06 19:43

小张小张快来学习的博客自动驾驶轨迹预测论文阅读—— Deep Learning-based Vehicle Behaviour Prediction For Autonomous Driving Applications: A Review
keras的网格搜索调参疑问 python 人工智能深度学习神经网络
2019-08-14 19:11

回答 2 已采纳自己搞定了。。折腾了一周。。最终发现是定义模型时，忘记传参了。。感觉自己简直是超级垃圾
交通预测论文翻译：Deep Learning on Traffic Prediction: Methods,Analysis and Future Directions
2021-07-12 21:09

UQI-LIUWJ的博客交通预测在智能交通系统中起着至关重要的作用。准确的交通预测可以辅助路线规划，指导车辆调度，缓解交通拥堵。由于路网中不同区域间复杂而又动态变化的时空依赖性，这一问题具有挑战性。近年来，人们对这一领域...
【原理+实战】AI所有领域SOTA综述（一）语音识别
2021-04-01 18:40

cv君的博客文章目录前言语音识别原理信号处理，声学特征提取识别字符，组成文本声学模型语言模型词汇模型语音声学特征提取：MFCC和LogFBank算法的原理...文章附带大量的算法原理+代码实现教学，欢迎关注，一起AI。语音识别原
智能校对的技术原理和实践
2022-01-17 10:32

Necther的博客传统的校对主要依赖人工，通过人来发现和纠正文本中的错误，人工校对效率低、强度大、周期长，显然已经不能满足目前文本快速增长的需求。智能校对系统在这个背景下应运而生。伴随着机器学习和自然语言处理技术的发展...
深度学习基础
2024-07-02 10:26

酱紫牙的博客 pytorch模型训练demo代码在PyTorch中，模型训练通常涉及几个关键步骤：定义模型、定义损失函数、选择优化器、准备数据加载器、编写训练循环。以下是一个简单的PyTorch模型训练演示代码，该代码实现了一个用于手写...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月28日

悬赏问题

¥15 Windows Script Host 无法找到脚本文件"C:\ProgramData\Player800\Cotrl.vbs”
¥15 matlab自定义损失函数
¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图

GRU代码预测出错，结果很差

24条回答 默认 最新

1. 理解滚动预测

2. 使用滚动预测进行预测

3. 滚动预测的具体实现

4. 在PYTHON中的滚动预测示例

5. 测试滚动预测

问题事件

悬赏问题

24条回答默认最新