优于LSTM预测股票价格的代码

这是我的代码，用lstm预测股票的价格，在这个代码的基础上，优化这个代码，使预测的结果更加清晰

import pandas as pd
def parse_date(date_string):
    return pd.Timestamp(date_string.replace('_', '-'))
df = pd.read_csv('D:/LSTMdata.csv', index_col='Date', parse_dates=True, date_parser=parse_date)
df.sort_index(inplace=True)
def Stock_Price_LSTM_Data_Precesing(df,mem_his_days,pre_days):
    df.dropna(inplace=True)
    df.sort_index(inplace=True)
    df['label']= df['Close'].shift(-pre_days)
    from sklearn.preprocessing import StandardScaler
    scaler = StandardScaler()
    sca_X=scaler.fit_transform(df.iloc[:,:-1])
    
    
    mem_his_days = 10
    
    from collections import deque
    deq = deque(maxlen=mem_his_days)
    
    X = []
    for i in sca_X:
        deq.append(list(i))
        if len(deq)==mem_his_days:
            X.append(list(deq))
    X_lately = X[-pre_days:]
    X = X[:-pre_days]
    y = df['label'].values[mem_his_days-1:-pre_days]
    
    
    import numpy as np
    X = np.array(X)
    y = np.array(y)
    return X,y,X_lately
X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,5,10)
print(len(X))
print(len(y))
print(len(X_lately))
pre_days = 10
mem_days=[5,10,15]
lstm_layers=[1,2,3]
dense_layers=[1,2,3]
units = [16,32]
# mem_days=[10]
# lstm_layers=[1]
# dense_layers=[1]
# units = [32]

from tensorflow.keras.callbacks import ModelCheckpoint
for the_mem_days in mem_days:
    for the_lstm_layers in lstm_layers:
        for the_dense_layers in dense_layers:
            for the_units in units:
                filepath=filepath=f"./theLSTMbestmodel1/{{val_mape:.2f}}{{epoch:02d}}men{the_mem_days}lstm{the_lstm_layers}dense{the_dense_layers}unit{the_units}.keras"
                checkpoint = ModelCheckpoint(
                    filepath=filepath,
                    save_weights_only=False,
                    monitor='val_mape',
                    mode='min',
                    save_best_only=True)
                X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,the_mem_days,pre_days)
                from sklearn.model_selection import train_test_split
                X_train,X_test,y_train,y_test = train_test_split(X,y,shuffle=False,test_size=0.1)
                import tensorflow as tf
                from tensorflow.keras.models import Sequential
                from tensorflow.keras.layers import LSTM,Dense,Dropout
                model = Sequential()
                model.add(LSTM(the_units,input_shape=X.shape[1:],activation='relu',return_sequences=True))
                model.add(Dropout(0.1))
                for i in range(the_lstm_layers):
                    model.add(LSTM(the_units,activation='relu',return_sequences=True))
                    model.add(Dropout(0.1))
                
                model.add(LSTM(the_units,activation='relu'))
                model.add(Dropout(0.1))
                for i in range(the_dense_layers):
                    model.add(Dense(the_units,activation='relu'))
                    model.add(Dropout(0.1))
                
                model.add(Dense(1))
                model.compile(optimizer='adam',
                             loss='mse',
                             metrics=['mape'])
                model.fit(X_train,y_train,batch_size=32,epochs=50,validation_data=(X_test,y_test),callbacks=[checkpoint])

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-05-06 21:02

关注

引自免费微信小程序：皆我百晓生

在您提供的代码基础上，我们可以进行一些改进以提高模型的性能并使得预测结果更清晰。以下是具体的建议和修改后的代码：

数据标准化：确保输入数据范围在相似尺度上对模型的训练很有帮助。您已经使用了StandardScaler对数据进行了预处理，但是我们还可以尝试其他的归一化方法，比如MinMaxScaler。
调整学习率：尝试使用不同的学习率，可能会影响模型的收敛速度和最终表现。
早停法（EarlyStopping）：添加一个早停回调，当验证损失不再降低时停止训练，防止过拟合。
模型复杂度：减少过度复杂的模型，尝试只保留最优的层结构组合，例如只保留一个LSTM层和一个全连接层。
正则化：增加权重衰减（L1、L2），有助于防止过拟合。
批量大小：调整批量大小，看看是否能改善训练效果。
优化器：除了Adam外，可以尝试其他优化器，如RMSprop或SGD。
随机种子：设置随机种子以确保实验可重复性。
可视化：绘制训练过程中的损失和验证损失曲线，以便观察模型的训练趋势。

下面是根据上述建议修改后的代码：

import pandas as pd
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout
from tensorflow.keras.optimizers import Adam, RMSprop, SGD
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler

np.random.seed(42)
tf.random.set_seed(42)

def parse_date(date_string):
    return pd.Timestamp(date_string.replace('_', '-'))

df = pd.read_csv('D:/LSTMdata.csv', index_col='Date', parse_dates=True, date_parser=parse_date)
df.sort_index(inplace=True)

def Stock_Price_LSTM_Data_Precesing(df, mem_his_days, pre_days):
    df.dropna(inplace=True)
    df.sort_index(inplace=True)
    df['label'] = df['Close'].shift(-pre_days)

    # 使用MinMaxScaler
    scaler = MinMaxScaler()
    scaled_df = scaler.fit_transform(df)

    mem_his_days = 10

    from collections import deque
    deq = deque(maxlen=mem_his_days)

    X = []
    for i in scaled_df[:, :-1]:
        deq.append(list(i))
        if len(deq) == mem_his_days:
            X.append(list(deq))
    X_lately = X[-pre_days:]
    X = X[:-pre_days]
    y = df['label'].values[mem_his_days - 1:-pre_days]

    X = np.array(X)
    y = np.array(y)
    return X, y, X_lately

pre_days = 10
mem_days = [10]  # 选择一个值来简化搜索空间
lstm_layers = [1]  # 同样简化搜索空间
dense_layers = [1]
units = [32]

# 调整参数
batch_sizes = [32, 64]  # 尝试不同的批量大小
learning_rates = [0.001, 0.0001]  # 不同的学习率
optimizer_names = ['adam', 'rmsprop', 'sgd']  # 尝试不同优化器
weight_regularization = [0.001, 0.0001]  # 添加权重衰减

# 早停和模型保存
filepath = "./theLSTMbestmodel1/val_mape_{val_mape:.2f}_epoch_{epoch:02d}_men{mem_days}_lstm{lstm_layers}_dense{dense_layers}_unit{units}.h5"
early_stopping = EarlyStopping(monitor='val_loss', patience=5, restore_best_weights=True)
checkpoint = ModelCheckpoint(filepath, save_best_only=True, monitor='val_loss')

for the_mem_days in mem_days:
    for the_lstm_layers in lstm_layers:
        for the_dense_layers in dense_layers:
            for the_units in units:
                for batch_size in batch_sizes:
                    for learning_rate in learning_rates:
                        for optimizer_name in optimizer_names:
                            for weight_reg in weight_regularization:

                                X, y, X_lately = Stock_Price_LSTM_Data_Precesing(df, the_mem_days, pre_days)
                                X_train, X_test, y_train, y_test = train_test_split(X, y, shuffle=False, test_size=0.1)

                                model = Sequential()
                                model.add(LSTM(units, input_shape=X.shape[1:], activation='relu', return_sequences=True))
                                model.add(Dropout(0.1))

                                model.add(LSTM(units, activation='relu', return_sequences=True))
                                model.add(Dropout(0.1))

                                model.add(LSTM(units, activation='relu'))
                                model.add(Dropout(0.1))

                                model.add(Dense(units, activation='relu'))
                                model.add(Dropout(0.1))

                                model.add(Dense(1))
                                model.compile(optimizer=getattr(tf.keras.optimizers, optimizer_name)(learning_rate=learning_rate, 
                                                                                          kernel_regularizer=tf.keras.regularizers.l2(weight_reg)),
                                             loss='mse',
                                             metrics=['mape'])

                                history = model.fit(X_train, y_train, batch_size=batch_size, epochs=50, validation_data=(X_test, y_test),
                                                   callbacks=[early_stopping, checkpoint])

                                # 可视化训练过程
                                plt.plot(history.history['loss'], label='Training Loss')
                                plt.plot(history.history['val_loss'], label='Validation Loss')
                                plt.xlabel("Epochs")
                                plt.ylabel("Loss")
                                plt.legend()
                                plt.show()

# 在这里，您可以进一步分析历史记录，找出最佳模型，并根据需要进行预测

请注意，这只是一个基础的优化方案，实际应用中可能需要更多的调整和试验。同时，由于代码的运行时间和计算资源需求可能会显著增加，因此可能需要在具有足够计算能力的环境中执行此代码。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

基于LSTM的股票价格预测模型与对比实验（Python源码实现）
2025-10-03 03:46

kleo3270的博客股票时间序列数据采集与预处理在构建基于LSTM的股票价格预测模型过程中，高质量的数据是整个建模流程的基础。真实、完整且结构合理的金融时间序列数据不仅决定了模型能否学习到有效的市场动态规律，也直接影响其...
使用LLMs自动生成的LSTM代码在金融和股票数据预测中的表现
2025-01-10 09:59

AI趋势预见的博客本文考察了LLMs，特别是GPT-3.5-Turbo、Falcon、Llama 2和PaLM，在帮助专业数据分析师自动生成深度学习模型及其执行代码方面的作用，旨在简化复杂编程语言的学习过程。由于LSTM在时间序列异常检测、URL检测以及智能...
（ICLR-2024）TIME‑LLM：基于大语言模型重编程的时间序列预测
2025-12-11 16:47

山科智能信息处理实验室的博客 TIME-LLM 提出了一种无需微调大语言模型主体、即可用于时间序列预测的全新框架。通过将时间序列片段重编程为一组可被 LLM 理解的“文本原型”，并结合包含数据背景、任务指令与统计特征的 Prompt-as-Prefix 提示结构...
EEMD-SSA-LSTM、EEMD-LSTM、SSA-LSTM、LSTM时间序列预测对比
2025-04-29 12:40

天天Matlab代码科研顾问的博客近年来，随着深度学习技术的飞速发展，长短期记忆网络（LSTM）因其强大的捕捉时间序列中长期依赖关系的能力，在时间序列预测领域取得了显著进展。然而，单一的LSTM模型在处理包含复杂模式和噪声的非平稳序列时，仍...
Agent 行为预测建模全解：Transformer vs LSTM 架构对比与实战优化路径
2025-05-02 18:36

观熵的博客本文聚焦 LSTM 与 Transformer 两类主流序列建模结构，在行为预测任务中的架构特性、建模能力、泛化性能与工程部署表现展开深度对比。通过真实业务案例构建统一实验基线，系统呈现两者在状态建模、长序列依赖处理、...
深度学习毕设项目：机器学习基于LSTM-CNN-CBAM模型的股票预测研究
2026-01-04 22:43

VX_bishe7的博客主要内容：免费开题报告、任务书、全bao定制+中期检查PPT、代码编写、文编写和辅导、文降重、长期答辩答疑辅导、一对一专业代码讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。
计算机毕业设计Python+LSTM股票行情预测系统量化交易分析股票爬虫大数据毕业设计(源码+文档 +PPT+讲解)
2025-11-23 21:02

B站计算机毕业设计大学的博客 LSTM模型通过门控机制有效捕捉股票价格的时间依赖性，结合多模态数据融合技术（如CNN、注意力机制）提升预测精度。系统实现涉及数据采集与预处理、量化策略设计（阈值法、动量策略等）以及实时推理架构。当前研究...
Python多层LSTM优化Seq2Seq序列模型预测社交网站用户签到时空轨迹数据
2025-06-11 04:37

拓端研究室TRL的博客通过均方根误差（RMSE）和决定系数（R²）评估模型表现：Seq2Seq模型的RMSE最低（0.086），R²达0.354，显著优于LSTM（RMSE=0.104，R²=0.228）和Transformer（RMSE=0.113，R²=-0.208）。清洗后的数据保存为CSV格式...
【毕业设计】基于 python的LSTM-CNN-CBAM模型的股票预测研究
2026-01-04 22:43

硕博团队计算机辅导的博客主要内容：免费开题报告、任务书、全bao定制+中期检查PPT、代码编写、文编写和辅导、文降重、长期答辩答疑辅导、一对一专业代码讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。
基于ARIMA、LSTM、GRU等神经网络模型对城市空气质量（AQI）预测分析及聚类研究
2025-06-30 10:45

王小王-123的博客通过可视化分析发现空气质量呈现季节性差异，夏季优于冬季，沿海地区优于内陆。采用层次聚类将空气质量分为两类，识别出春夏季污染较轻、秋冬季较重的特征。运用ARIMA(3,1,1)模型进行预测，显示未来AQI指数将稳定在...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月6日

优于LSTM预测股票价格的代码

2条回答 默认 最新

问题事件

2条回答默认最新