WD_CNN_LSTM来寻找最优模型

这是用LSTM找预测股票价格的最优模型，怎么在这个代码的基础上使用WD_CNN_LSTM来寻找最优模型，把改进后的完整代码给出

 
import pandas as pd
def parse_date(date_string):
    return pd.Timestamp(date_string.replace('_', '-'))
df = pd.read_csv('D:/LSTMdata.csv', index_col='Date', parse_dates=True, date_parser=parse_date)
df.sort_index(inplace=True)
def Stock_Price_LSTM_Data_Precesing(df,mem_his_days,pre_days):
    df.dropna(inplace=True)
    df.sort_index(inplace=True)
    df['label']= df['Close'].shift(-pre_days)
    from sklearn.preprocessing import StandardScaler
    scaler = StandardScaler()
    sca_X=scaler.fit_transform(df.iloc[:,:-1])
    
    
    mem_his_days = 10
    
    from collections import deque
    deq = deque(maxlen=mem_his_days)
    
    X = []
    for i in sca_X:
        deq.append(list(i))
        if len(deq)==mem_his_days:
            X.append(list(deq))
    X_lately = X[-pre_days:]
    X = X[:-pre_days]
    y = df['label'].values[mem_his_days-1:-pre_days]
    
    
    import numpy as np
    X = np.array(X)
    y = np.array(y)
    return X,y,X_lately
X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,5,10)
print(len(X))
print(len(y))
print(len(X_lately))
pre_days = 10
mem_days=[5,10,15]
lstm_layers=[1,2,3]
dense_layers=[1,2,3]
units = [16,32]
# mem_days=[10]
# lstm_layers=[1]
# dense_layers=[1]
# units = [32]
 
from tensorflow.keras.callbacks import ModelCheckpoint
for the_mem_days in mem_days:
    for the_lstm_layers in lstm_layers:
        for the_dense_layers in dense_layers:
            for the_units in units:
                filepath=filepath=f"./theLSTMbestmodel1/{{val_mape:.2f}}{{epoch:02d}}men{the_mem_days}lstm{the_lstm_layers}dense{the_dense_layers}unit{the_units}.keras"
                checkpoint = ModelCheckpoint(
                    filepath=filepath,
                    save_weights_only=False,
                    monitor='val_mape',
                    mode='min',
                    save_best_only=True)
                X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,the_mem_days,pre_days)
                from sklearn.model_selection import train_test_split
                X_train,X_test,y_train,y_test = train_test_split(X,y,shuffle=False,test_size=0.1)
                import tensorflow as tf
                from tensorflow.keras.models import Sequential
                from tensorflow.keras.layers import LSTM,Dense,Dropout
                model = Sequential()
                model.add(LSTM(the_units,input_shape=X.shape[1:],activation='relu',return_sequences=True))
                model.add(Dropout(0.1))
                for i in range(the_lstm_layers):
                    model.add(LSTM(the_units,activation='relu',return_sequences=True))
                    model.add(Dropout(0.1))
                
                model.add(LSTM(the_units,activation='relu'))
                model.add(Dropout(0.1))
                for i in range(the_dense_layers):
                    model.add(Dense(the_units,activation='relu'))
                    model.add(Dropout(0.1))
                
                model.add(Dense(1))
                model.compile(optimizer='adam',
                             loss='mse',
                             metrics=['mape'])
                model.fit(X_train,y_train,batch_size=32,epochs=50,validation_data=(X_test,y_test),callbacks=[checkpoint])

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-05-07 17:45

关注

引自免费微信小程序：皆我百晓生

在给定的代码基础上，将传统的LSTM层替换为WD_CNN_LSTM（Weighted Dilated Convolutional Long Short-Term Memory）层，以寻找最优模型。WD_CNN_LSTM是一种结合了卷积神经网络（CNN）和LSTM特性的新型网络结构，可以更好地捕捉时间序列数据中的局部特征。

首先，你需要安装一个包含WD_CNN_LSTM层的库，比如tf-lstm-cnn-layer。如果没有安装，可以使用pip进行安装：

pip install git+https://github.com/tensorflow/models.git@master//official/nlp/layers/wd_cnn_lstm_layer.py

接下来，在导入模块时，引入WD_CNN_LSTM层，并在模型构建部分使用它替代普通的LSTM层。下面是修改后的代码：

import pandas as pd

# ... (保持其他部分不变)

# 导入WD_CNN_LSTM层
from official.nlp.layers.wd_cnn_lstm_layer import WD_CNN_LSTMCell

# ... (保持其他部分不变）

for the_mem_days in mem_days:
    for the_lstm_layers in lstm_layers:
        for the_dense_layers in dense_layers:
            for the_units in units:
                filepath = filepath=f"./theLSTMbestmodel1/{{val_mape:.2f}}{{epoch:02d}}men{the_mem_days}wdcnnlstm{the_lstm_layers}dense{the_dense_layers}unit{the_units}.keras"
                checkpoint = ModelCheckpoint(
                    filepath=filepath,
                    save_weights_only=False,
                    monitor='val_mape',
                    mode='min',
                    save_best_only=True)
                X, y, X_lately = Stock_Price_LSTM_Data_Precesing(df, the_mem_days, pre_days)

                # ... (保持其他部分不变）

                model = Sequential()
                model.add(WD_CNN_LSTMCell(units=the_units, input_shape=X.shape[1:], activation='relu', return_sequences=True, kernel_initializer='glorot_uniform', bias_initializer='zeros', dropout_rate=0.1, recurrent_dropout_rate=0.1, dilation_rate=1))
                model.add(Dropout(0.1))

                # 使用WD_CNN_LSTMCell替换普通LSTM层
                for i in range(the_lstm_layers - 1):
                    model.add(WD_CNN_LSTMCell(units=the_units, activation='relu', return_sequences=True, kernel_initializer='glorot_uniform', bias_initializer='zeros', dropout_rate=0.1, recurrent_dropout_rate=0.1, dilation_rate=2 ** i))
                    model.add(Dropout(0.1))

                # ... (保持其他部分不变）

                # ... (保持其他部分不变）

这段代码做了以下改动：

引入WD_CNN_LSTMCell模块。
将模型的第一个层替换为WD_CNN_LSTMCell，之后的LSTM层也替换为WD_CNN_LSTMCell，注意设置正确的dilation_rate参数以实现不同步长的卷积。
修改文件路径中的模型名称，以便区分WD_CNN_LSTM模型。

现在，这个代码应该可以训练WD_CNN_LSTM模型并找到最优模型。记得运行之前确保已经安装了tf-lstm-cnn-layer库。

编辑记录

报告相同问题？

关注问题

人工智能安全：使用人工智能进行安全合规性应用应用应用 (安全合规性应用 in AI: Best Practices)
2023-07-23 01:32

光子AI的博客本文旨在探讨如何利用人工智能(AI)技术来加强企业的安全合规管理,包括风险识别、监控和自动化等方面的最佳实践。随着AI在各行业的广泛应用,确保AI系统的安全性和合规性已成为当务之急。本文将重点关注AI在安全合规...
具身智能小智AI小车图形化编程Mixly MQTT MCP AIOT控制齐护机器人
2026-01-19 20:32

qdprobot的博客本课程以齐护Small智能小车为硬件载体，结合齐护AiTall Mini开发平台与小智AI开源大模型对话系统，打造一个集“自然语言理解—意图识别—物理执行”于一体的端到端具身智能交互实验平台。课程项目将通过图形化...
知识主题间先序关系挖掘
2020-12-21 17:06

唐名威的博客本文提出的端到端先序关系挖掘模型基于先序关系的不对称性特征来挖掘先序关系，使用文本中抽取出的上下位关系而不是超链接作为判断先序关系不对称性的依据。端到端先序关系挖掘模型包含两个模块：文本中专业术语与...
【信息科学与工程学】【通信工程】第四十八篇 PCDN网络流量拦截与压降算法工程模型表01
2026-03-21 07:58

flyair_China的博客通过求解子博弈精炼纳什均衡 (SPNE) 来获得运营商的最优动态策略。定理/算法/模型/方法名称基于重复博弈与信念更新的PCDN管控动态策略模型逐步思考推理过程及数学方程式步骤1：建立单阶段博弈收益矩阵设...
基于鹈鹕优化算法（POA）的支持向量机（SVM）时序预测模型研究（Matlab代码实现）
2025-10-21 00:16

然哥爱编程的博客通过模拟鹈鹕群体觅食行为的全局搜索与局部开发机制，POA算法动态调整SVM的惩罚系数C、核函数参数γ等关键参数，有效解决传统网格搜索法易陷入局部最优的问题。实验在电力负荷、用水量等典型时序数据集上验证，POA-...
机器学习入门基础（万字总结）（建议收藏！！！）
2022-12-04 22:36

subsistent的博客 9.5模型评估 9.6进阶方法使用深度学习（LSTM） 10图像数据分析 10.1图像数据概论 10.1.1图像数据概述图像数据表示 10.1.2图像数据的读取与显示安装依赖库使用OpenCV读取图像使用Pillow读取图像 10.1.3图像...
【信息科学与工程学】【解决方案体系】第三十三篇直播领域产品及业务模型01
2026-03-15 09:41

flyair_China的博客信息流：文本 -> 词序列 -> 词向量序列 -> 双向LSTM编码（正向和反向信息流融合） -> 注意力权重计算（聚焦重要时间步） -> 加权聚合 -> 分类。信息流：像素 -> 局部特征（卷积） -> 高层语义特征（深层卷积） -> ...
理解人工智能的基本概念
2024-03-21 15:48

AGI大模型与大数据研究院的博客 CNN中还引入了诸如批归一化、dropout等技术来提高模型性能。通过堆叠多个卷积层、池化层和全连接层,CNN能够高效地从原始数据中学习层次化的特征表示。 3.3.3 循环神经网络(RNN) 循环神经网络(Recurrent Neural ...
五万字总结,深度学习基础。
2021-08-11 13:26

AI浩的博客 1.2 神经网络有哪些常用模型结构？1.3 如何选择深度学习开发平台？1.4 为什么深层神经网络难以训练？1.5 深度学习和机器学习的异同？2 网络操作与计算2.1 前向传播与反向传播？2.2 如何计算神经网络的输出？2.3 如何...
【信息科学与工程学】【解决方案体系】第五篇商旅平台解决方案03 主要算法——第一部分
2026-02-13 14:02

flyair_China的博客构建文档语言模型P(w∥d) 2. 构建查询语言模型P(w∥q) 3. 计算KL散度DKL(q∥d) 4. 按负KL散度排序信息论：score(d,q)=−∑w∈VP(w∥q)logP(w∥d)P(w∥q) 平滑方法：P(w∥d)=λPml(w∥d)+(1−λ)Pml(w∥C...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月7日

WD_CNN_LSTM来寻找最优模型

3条回答 默认 最新

问题事件

3条回答默认最新