python对股票预测的时候下标的值变得不可控

运行一下我的程序，用LSTM方法来预测股票价格，为什么在进行最后一步绘图的时候下表直接到了3100年

import pandas as pd
file_path = r"D:\\findata.csv"  
df = pd.read_csv(file_path)
def Stock_Price_LSTM_Data_Precesing(df,mem_his_days,pre_days):
    df.dropna(inplace=True)
    df.sort_index(inplace=True)
    df['label']= df['Close'].shift(-pre_days)
    from sklearn.preprocessing import StandardScaler
    scaler = StandardScaler()
    sca_X=scaler.fit_transform(df.iloc[:,:-1])   
    mem_his_days = 10
    
    from collections import deque
    deq = deque(maxlen=mem_his_days)
    
    X = []
    for i in sca_X:
        deq.append(list(i))
        if len(deq)==mem_his_days:
            X.append(list(deq))
    X_lately = X[-pre_days:]
    X = X[:-pre_days]
    y = df['label'].values[mem_his_days-1:-pre_days]
    
    
    import numpy as np
    X = np.array(X)
    y = np.array(y)
    return X,y,X_lately
 
X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,5,10)
pre_days = 10
# mem_days=[5,10,15]
# lstm_layers=[1,2,3]
# dense_layers=[1,2,3]
# units = [16,32]
mem_days=[5]
lstm_layers=[3]
dense_layers=[2]
units =[32]
from tensorflow.keras.callbacks import ModelCheckpoint
 
for the_mem_days in mem_days:
    for the_lstm_layers in lstm_layers:
        for the_dense_layers in dense_layers:
            for the_units in units:
                filepath=f"./minefinalldata1/{{val_mape:.2f}}{{epoch:02d}}men{the_mem_days}lstm{the_lstm_layers}dense{the_dense_layers}unit{the_units}.keras"
                checkpoint = ModelCheckpoint(
                    filepath=filepath,
                    save_weights_only=False,
                    monitor='val_mape',
                    mode='min',
                    save_best_only=True)
                X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,the_mem_days,pre_days)
                from sklearn.model_selection import train_test_split
                X_train,X_test,y_train,y_test = train_test_split(X,y,shuffle=False,test_size=0.1)
                import tensorflow as tf
                from tensorflow.keras.models import Sequential
                from tensorflow.keras.layers import LSTM,Dense,Dropout
                model = Sequential()
                model.add(LSTM(the_units,input_shape=X.shape[1:],activation='relu',return_sequences=True))
                model.add(Dropout(0.1))
                for i in range(the_lstm_layers):
                    model.add(LSTM(the_units,activation='relu',return_sequences=True))
                    model.add(Dropout(0.1))
                
                model.add(LSTM(the_units,activation='relu'))
                model.add(Dropout(0.1))
                for i in range(the_dense_layers):
                    model.add(Dense(the_units,activation='relu'))
                    model.add(Dropout(0.1))
                
                model.add(Dense(1))
                model.compile(optimizer='adam',
                             loss='mse',
                             metrics=['mape'])
                model.fit(X_train,y_train,batch_size=32,epochs=50,validation_data=(X_test,y_test),callbacks=[checkpoint])
from tensorflow.keras.models import load_model
best_model = load_model('./minefinalldata1/7.3003men5lstm3dense2unit32.keras')
best_model.summary()
best_model.evaluate(X_test,y_test)
pre = best_model.predict(X_test)
print(len(pre))
import matplotlib.pyplot as plt
df_time = df.index[- len(y_test):]
plt.plot(df_time,y_test,color='red',label='price')
plt.plot(df_time,pre,color='green',label='predict')
plt.show()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-04-29 21:53
关注
参考免费微信小程序：皆我百晓生 作答，经由专家-皆知整理回复，如问题解决，望采纳；如仍有疑问，请评论回复。

你的问题在于绘图时日期范围突然扩展到3100年，这通常是因为在处理时间序列数据时，预测部分的索引没有正确设置，导致了错误的日期生成。在你的代码中，直接使用了df.index[- len(y_test):]来获取时间索引，但预测后的数据并没有对应的真实日期，所以你需要创建一个逻辑来生成预测日期的索引。

以下是修复这个问题的方法，主要集中在如何为预测结果生成正确的日期索引，并用于绘图：

首先，确保你的原始DataFrame df 的索引是日期类型。如果原始CSV文件中的日期不是日期类型，你需要将其转换为pd.to_datetime。然后，我们创建一个新的日期范围来匹配预测数据的长度。

修改后的绘图部分代码如下：

import pandas as pd import matplotlib.pyplot as plt # 假设df的索引已经是日期类型，如果不是，请先转换： # df.index = pd.to_datetime(df.index) # 获取训练数据结束日期和预测数据的长度 end_date = df.index[-1] forecast_dates = pd.date_range(end=end_date, periods=len(y_test) + len(pre), closed='right')[1:] plt.figure(figsize=(14,7)) plt.plot(forecast_dates, y_test, color='red', label='Actual Price') plt.plot(forecast_dates, pre, color='green', label='Predicted Price') # 设置图表标题和标签 plt.title('Stock Price Prediction') plt.xlabel('Date') plt.ylabel('Price') plt.legend() plt.grid(True) plt.show()

这段代码的关键点在于创建了forecast_dates，它从训练数据的最后一个日期开始，向后扩展出与预测结果相同长度的日期序列。这样，无论预测的长度如何，都能确保日期索引是正确的，并且不会莫名地延伸到未来很远的日期。请确保你的DataFrame索引正确反映了时间序列的日期。如果原始数据索引不是日期格式，记得先进行转换。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

2. 编程语言-Python
2025-12-03 16:57

真上帝的左手的博客 Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。
2024年09月CCF-GESP编程能力等级认证Python编程三级真题解析
2024-11-17 22:16

码农StayUp的博客按照题目所示代码的逻辑是在遍历字符串的过程中碰到数字0和数字0跳过，其余的被替换为&字符，但是replace函数并不会修改字符串本身这是一个需要注意的知识点，而且字符串在Python中是不可变的，因此选择A选项。...
短期内快速掌握Python编程基础
2025-04-04 22:31

张彦峰ZYF的博客本文从工程实践视角出发，对 Python 基础知识进行了系统梳理与...文章不追求速成，而强调理解与动手实践，适合初学者入门，也可作为有编程经验读者回顾 Python 基础的参考材料，为后续深入学习与实际应用打下稳定基础。
关于我的编程语言——Python——第二篇
2024-10-22 08:00

ChaoZiLL的博客（叠甲：如有侵权请联系，内容都是自己学习的总结，一定不全面，仅当互相交流（轻点骂）我也只是站在巨人肩膀上的一个小卡拉米，已老实，求放过）
Python期末复习知识点大合集（期末不挂科版）
2023-02-14 16:18

林天北的博客 Python期末考试知识点总结大合集（期末不挂科版）,祝大家期末考试顺利通过！！！总结不易，期待得到你们的点赞收藏转发三连，谢谢！
python语言总结（持续更新）
2025-03-07 22:19

Sean_summer的博客 return [表达式]结束函数，选择性地返回一个值给调用方。不带表达式的return相当于返回 None。sum=a+bprint(sum)sum(3,5)#输出8自定义函数后的调用，就直接用自己定义的函数名就行了，比如上面的例子就是定义了一个...
Python游戏编程入门-如何用Python制作飞机大战小游戏
2024-07-31 16:56

独角兽哆啦A梦的博客前言在上一节我们完成了对...这样我们就可以使得敌机每次出现的位置变得不可预测了~(｡･ω･｡)跟之前的风格类似，我们把敌机封装成类，主要是为了能够更方便地使用碰撞检测的功能。导入图片资源当然是必不可少的啦；
Pygame：Python游戏编程入门（新手必备）
2024-08-16 15:02

Python_trys的博客在上一节我们完成了对玩家飞机的基本操作，这一节我们就来创造出敌人了(°∀°)ﾉ~目标有三个，第一个是在屏幕上绘制出敌机，第二个是判断子弹是否击中了敌人，第三个是对被击中的敌人作后续的处理。明白方向后就...
【Python】Python核心编程
2019-06-13 22:41

诗与浪子的博客 Python核心编程数据类型数值类型（整数，浮点，布尔）序列类型（字符串，列表，元组）散列类型（字典，集合）字节类型 a=bytes(‘123’)/a=b’123’ 字节数组bytearrary(‘123’) 数据类型的方法字符串方法： ...
Python - 高级动态编程语言 - 入门基础知识（上）
2021-04-17 09:58

名字里有三个木的博客 Python 是一种易于学习、功能强大的高级编程语言。它提供了高效的高级数据结构，还能简单有效地面向对象编程。Python 优雅的语法和动态类型，以及解释型语言的本质，使它成为多数平台上写脚本和快速开发应用的理想...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月29日

python对股票预测的时候下标的值变得不可控

5条回答 默认 最新

问题事件

5条回答默认最新