WD-CNN-LSTM模型来对股票价格进行预测

这是我的代码，用LSTM模型来预测股票的价格，在这个代码的基础上怎么用WD-CNN-LSTM模型来对股票价格进行预测

import pandas as pd
def parse_date(date_string):
    return pd.Timestamp(date_string.replace('_', '-'))
df = pd.read_csv('D:/LSTMdata.csv', index_col='Date', parse_dates=True, date_parser=parse_date)
df.sort_index(inplace=True)
def Stock_Price_LSTM_Data_Precesing(df,mem_his_days,pre_days):
    df.dropna(inplace=True)
    df.sort_index(inplace=True)
    df['label']= df['Close'].shift(-pre_days)
    from sklearn.preprocessing import StandardScaler
    scaler = StandardScaler()
    sca_X=scaler.fit_transform(df.iloc[:,:-1])
    
    
    mem_his_days = 10
    
    from collections import deque
    deq = deque(maxlen=mem_his_days)
    
    X = []
    for i in sca_X:
        deq.append(list(i))
        if len(deq)==mem_his_days:
            X.append(list(deq))
    X_lately = X[-pre_days:]
    X = X[:-pre_days]
    y = df['label'].values[mem_his_days-1:-pre_days]
    
    
    import numpy as np
    X = np.array(X)
    y = np.array(y)
    return X,y,X_lately
X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,5,10)
print(len(X))
print(len(y))
print(len(X_lately))
pre_days = 10
mem_days=[5,10,15]
lstm_layers=[1,2,3]
dense_layers=[1,2,3]
units = [16,32]
# mem_days=[10]
# lstm_layers=[1]
# dense_layers=[1]
# units = [32]

from tensorflow.keras.callbacks import ModelCheckpoint
for the_mem_days in mem_days:
    for the_lstm_layers in lstm_layers:
        for the_dense_layers in dense_layers:
            for the_units in units:
                filepath=filepath=f"./theLSTMbestmodel1/{{val_mape:.2f}}{{epoch:02d}}men{the_mem_days}lstm{the_lstm_layers}dense{the_dense_layers}unit{the_units}.keras"
                checkpoint = ModelCheckpoint(
                    filepath=filepath,
                    save_weights_only=False,
                    monitor='val_mape',
                    mode='min',
                    save_best_only=True)
                X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,the_mem_days,pre_days)
                from sklearn.model_selection import train_test_split
                X_train,X_test,y_train,y_test = train_test_split(X,y,shuffle=False,test_size=0.1)
                import tensorflow as tf
                from tensorflow.keras.models import Sequential
                from tensorflow.keras.layers import LSTM,Dense,Dropout
                model = Sequential()
                model.add(LSTM(the_units,input_shape=X.shape[1:],activation='relu',return_sequences=True))
                model.add(Dropout(0.1))
                for i in range(the_lstm_layers):
                    model.add(LSTM(the_units,activation='relu',return_sequences=True))
                    model.add(Dropout(0.1))
                
                model.add(LSTM(the_units,activation='relu'))
                model.add(Dropout(0.1))
                for i in range(the_dense_layers):
                    model.add(Dense(the_units,activation='relu'))
                    model.add(Dropout(0.1))
                
                model.add(Dense(1))
                model.compile(optimizer='adam',
                             loss='mse',
                             metrics=['mape'])
                model.fit(X_train,y_train,batch_size=32,epochs=50,validation_data=(X_test,y_test),callbacks=[checkpoint])

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-05-06 21:11

关注

引自免费微信小程序：皆我百晓生

在给定的LSTM模型基础上，我们可以将其扩展为WD-CNN (Weighted Dilated Convolutional Neural Network) 模型。WD-CNN有助于捕捉不同时间尺度上的特征，并通过权重分配来强化重要信息。首先，我们需要引入卷积层并应用可变孔径（dilated convolution）以增加模型的时间域感知。然后，我们将使用注意力机制来计算每个时间步的重要性权重。

以下是将现有LSTM模型转换为WD-CNN-LSTM模型的步骤：

添加WD-CNN层到LSTM模型之前。
使用注意力机制计算时间步的重要性权重。
将注意力加权后的输出传递给LSTM层。

下面是修改后的代码：

import pandas as pd
import tensorflow as tf
from tensorflow.keras.layers import Input, Dense, Dropout, LSTM, LayerNormalization, TimeDistributed
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.metrics import MeanAbsolutePercentageError
from tensorflow.keras.callbacks import ModelCheckpoint
from tensorflow.keras import backend as K

def parse_date(date_string):
    return pd.Timestamp(date_string.replace('_', '-'))

def Stock_Price_WDCNNSeqData_Precesing(df, mem_his_days, pre_days):
    # ...保持原有数据预处理部分不变...

    # 新增WD-CNN部分
    def dilated_causal_conv(input, filters, kernel_size, rate):
        conv = tf.keras.layers.Conv1D(filters=filters, kernel_size=kernel_size, padding="causal", dilation_rate=rate)
        x = conv(input)
        return x

    def attention_layer(x):
        x = tf.expand_dims(x, axis=-1)
        w = tf.keras.layers.Dense(1)(x)
        w = tf.nn.softmax(w, axis=1)
        output = tf.reduce_sum(tf.multiply(x, w), axis=1)
        return output

    def WDCNN_block(inputs, filters, kernel_size, num_blocks):
        x = inputs
        for _ in range(num_blocks):
            x = dilated_causal_conv(x, filters, kernel_size, rate=1)
            x = LayerNormalization()(x)
            x = tf.nn.relu(x)
            x = dilated_causal_conv(x, filters, kernel_size, rate=2)
            x = LayerNormalization()(x)
            x = tf.nn.relu(x)
        return x

    X = []
    for i in sca_X:
        deq.append(list(i))
        if len(deq) == mem_his_days:
            X.append(list(deq))
    X_lately = X[-pre_days:]
    X = X[:-pre_days]
    y = df['label'].values[mem_his_days - 1:-pre_days]

    # 将X转换为4维张量，以便与WD-CNN输入兼容
    X = np.reshape(X, (-1, mem_his_days, 1, len(sca_X[0])))

    # WD-CNN 部分
    input_seq = Input(shape=(mem_his_days, 1, len(sca_X[0])))
    x = WDCNN_block(input_seq, filters=the_units, kernel_size=3, num_blocks=2)
    x = attention_layer(x)
    
    # 原有LSTM部分
    x = LSTM(the_units, activation='relu', return_sequences=True)(x)
    x = Dropout(0.1)(x)
    for i in range(the_lstm_layers - 1):
        x = LSTM(the_units, activation='relu', return_sequences=True)(x)
        x = Dropout(0.1)(x)

    x = LSTM(the_units, activation='relu')(x)
    x = Dropout(0.1)
    for i in range(the_dense_layers):
        x = Dense(the_units, activation='relu')(x)
        x = Dropout(0.1)

    outputs = Dense(1)(x)
    model = Model(inputs=input_seq, outputs=outputs)

    # ...保持优化器、损失函数和训练过程不变...

这段代码中，我们添加了一个名为WDCNN_block的函数，它实现了具有多个不同膨胀率的WD-CNN块。然后，我们在输入序列上应用了WD-CNN块，并使用注意力层来计算每个时间步的重要性权重。最后，我们将注意力加权后的输出传递给LSTM层。

注意：为了简化代码，这里没有包含完整的训练循环和回调设置。你需要将上述代码片段整合到你的原始代码中，替换原有的LSTM模型创建部分，并确保所有变量（如the_units等）的值是匹配的。这样，你就可以使用WD-CNN-LSTM模型进行股票价格预测了。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(2条)

报告相同问题？

关注问题

万字长文！大语言模型LLM如何用数学解决工业场景问题！
2026-01-05 11:56

大耳朵爱学习的博客本文详细解析了大语言模型(LLM)的数学原理和训练过程，从Transformer架构到自注意力机制，从神经网络基础到反向传播算法，深入浅出地解释了LLM如何利用数学解决工业问题。同时探讨了大规模训练集群的必要性及GPU并行...
人工智能安全：使用人工智能进行安全合规性应用应用应用 (安全合规性应用 in AI: Best Practices)
2023-07-23 01:32

光子AI的博客本文旨在探讨如何利用人工智能(AI)技术来加强企业的安全合规管理,包括风险识别、监控和自动化等方面的最佳实践。随着AI在各行业的广泛应用,确保AI系统的安全性和合规性已成为当务之急。本文将重点关注AI在安全合规...
一文回顾生成式AI的发展：GANs、GPT、自编码器、扩散模型和Transformer系列
2024-09-07 06:00

AI大模型学习不迷路的博客生成对抗网络（GAN）是一种无监督的生成模型，由两个神经网络组成：一个生成器和一个判别器。生成器试图制造与真实数据无法区分的新数据（伪造数据），而判别器则试图区分真实数据和伪造数据。下图8展示了GAN的原理...
自然语言处理之文本摘要：Transformer：注意力机制详解
2025-06-02 07:45

zhubeibei168的博客序列到序列（Seq2Seq）模型是一种用于处理序列输入并生成序列输出的神经网络架构，广泛应用于机器翻译、文本摘要、对话系统等任务。Seq2Seq模型通常由编码器（Encoder）和解码器（Decoder）组成，编码器将输入序列...
为了更好地理解深度学习模型的效果，我们以Kaggle提供的房价预测数据集作为示例。
2023-09-07 07:05

光子AI的博客对于住建行业来说，预测房屋价格对公司的营收及销售额至关重要。而对于房屋的价格预测，传统的统计方法或机器学习方法往往并不准确。近年来，基于神经网络的方法受到了越来越多人的关注，尤其是在计算机视觉、自然...
Deep Visual-Semantic Alignments for Generating Image Descriptions 翻译
2017-11-12 10:54

dsjdjsa的博客 Abstract 摘要We present a model that generates natural language descriptions of...我们提出一个模型来生成图像及其区域的自然语言描述。Our approach leverages datasets of images and their sentence descriptio
【交通流预测】《Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic For》论文详解
2022-01-16 22:47

AI-Transportation的博客近年来，经典的统计模型在交通预测任务中受到了机器学习方法的有力挑战。这些模型如k近邻算法(KNN)、支持向量机(SVM)和神经网络(NN)可以实现更高的预测精度和更复杂的数据建模。深度学习：最近，深度学习已经被...
基于鹈鹕优化算法（POA）的支持向量机（SVM）时序预测模型研究（Matlab代码实现）
2025-10-21 05:04

杰哥爱编程_yyds的博客本文提出一种基于鹈鹕优化算法（POA）优化支持向量机（SVM）参数的时序预测模型（POA-SVM）。通过模拟鹈鹕群体觅食行为的全局搜索与局部开发机制，POA算法动态调整SVM的惩罚系数C、核函数参数γ等关键参数，有效解决...
网络安全模型研究资源汇总（非常详细）零基础入门到精通，收藏这一篇就够了_开源的网络安全模型
2024-06-26 15:30

AI大模型-搬运工的博客这是一个精心整理的网络安全模型资源汇总，旨在为研究人员、工程师及安全爱好者提供一个全面的参考集合。本项目覆盖了模型/项目、学术论文、数据集以及相关产品信息，帮助你深入了解和应用网络安全领域的最新进展。...
斯坦福NLP名课带学详解 | CS224n 第3讲 - 神经网络知识回顾（NLP通关指南·完结）
2022-04-29 13:50

ShowMeAI的博客 NLP课程第3讲主要内容是回顾神经网络知识，并基于NLP场景讲解命名实体识别、基于窗口数据的预测、基于pytorch实现的分类器等。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月6日

WD-CNN-LSTM模型来对股票价格进行预测

3条回答 默认 最新

问题事件

3条回答默认最新