我现在在做一个时间序列预测的项目。数据是销量数据,只有日期和销量两类特征,我在网上搜索LSTM方法来进行预测时,发现很多博主的文章都没有提到如何用训练好的模型来预测未来的销量,他们只是对已知的数据划分训练集和测试集,用训练集训练对应的模型参数,然后用测试集来验证训练集训练模型的好坏。但是对于未知的数据,大多数博主没有提到如何进行预测和数据输入。
比如我目前已知的数据是2021/1/1
之前在训练时,直接就把整个2021/1/1~2022/9/30的数据一起输进去了,然后代码自动划分数据集,如下
dataframe = pd.read_csv(r"D:\桌面文件夹哦\数据统计\悠度数据\2特征.CSV", usecols=[1], engine='python', skipfooter=3)
dataset = dataframe.values
# 将整型变为float
dataset = dataset.astype('float32')
# 归一化 在下一步会讲解
scaler = MinMaxScaler(feature_range=(0, 1))
dataset = scaler.fit_transform(dataset)
train_size = int(len(dataset) * 0.8)
trainlist = dataset[:train_size]
testlist = dataset[train_size:]
那么对于我的这种单变量数据来说,应该怎么设置新的输入数据来预测对应的未来输入值呢?像多特征数据,比如股票预测,你可以输入除预测值之外的其它4个特征数据,比如你要预测后七天的开盘价,那么你可以输入后七天中除开盘价之外的四个特征数据,如下所示
而总的特征有五个,如下所示
所以,我想请各位指点一下,谢谢各位~