为什么用lstm做时序预测结果这么差（用paddlepaddle实现的）

from __future__ import print_function
import numpy as np
import math
import matplotlib.pyplot as plt
import paddle
import paddle.fluid as fluid
import pandas as pd
#数据预处理用的模块
import math
from sklearn.preprocessing import MinMaxScaler

confirmed_df = pd.read_csv('time_series_covid19_confirmed_global.csv')
Japan_df = confirmed_df.iloc[[139]]
dataset = Japan_df.values.reshape(-1,1)
Japan_dataset = []
l = len(dataset)
for i in range(4,l):
    Japan_dataset.append(dataset[i])
Japan_array_dataset = np.array(Japan_dataset)
Japan_array_dataset = Japan_array_dataset.astype(np.float32)
print(Japan_array_dataset.dtype)
Japan_df_dataset = pd.DataFrame(Japan_array_dataset)
# 处理样本数据
#look_back 就是预测下一步所需要的 time_steps
def create_dataset(dataset, time_steps=1):
    dataX, dataY = [], []
    for i in range(len(dataset)-time_steps-1):
        a = Japan_array_dataset[i:(i+time_steps), 0]
        dataX.append(a)
        dataY.append(dataset[i + time_steps, 0])
    return np.array(dataX), np.array(dataY)

np.random.seed(6)
# 归一化，将数据重新调整到0到1的范围，因为LSTM对数据比较敏感
scaler = MinMaxScaler(feature_range=(0, 1))
Japan_array_dataset = scaler.fit_transform(Japan_array_dataset)
 
#  划分训练集与测试集
train_size = int(len(Japan_array_dataset) * 0.7) #训练集样本数量
test_size = len(Japan_array_dataset) - train_size #测试集样本数量
train, test = Japan_array_dataset[0:train_size,:], Japan_array_dataset[train_size:len(Japan_array_dataset),:]

time_steps = 1
train_x, train_y = create_dataset(train, time_steps) #获取训练集（样本数据，样本标签）
test_x, test_y = create_dataset(test, time_steps) #获取测试集（样本数据，样本标签）

#定义Data Reader
def read_data(data_x,data_y):
    def reader():
        for x, y in zip(data_x,data_y):
            yield x[:], y
    return reader
#定义数据提供器（Datafeeder）
train_reader = paddle.batch(
    read_data(train_x,train_y),
    batch_size=10)
#定义网络结构
x = fluid.layers.data(name='x',shape=[1],dtype='float32',lod_level= 1) #lod_level=0则表示输入数据不是一个序列
y = fluid.layers.data(name='y',shape=[1],dtype='float32')
print(x)
#构建LSTMC层
DIM = 1 #隐藏层大小
fc = fluid.layers.fc(input=x, size=DIM * 4)
lstm_h, c = fluid.layers.dynamic_lstm( input=fc, size=DIM * 4, is_reverse=False) #paddlepaddle中规定了size=4*隐藏层大小
# 最大池化
lstm_max = fluid.layers.sequence_pool(input=lstm_h, pool_type='max')
# 激活函数
lstm_max_tanh = fluid.layers.tanh(lstm_max)
# 全连接层
prediction = fluid.layers.fc(input=lstm_max_tanh, size=1, act='tanh')
from paddle.utils.plot import Ploter

cost = fluid.layers.square_error_cost(input=prediction,label=y)  # 利用标签数据和输出的预测数据，求一个batch的损失值
avg_loss = fluid.layers.mean(cost) #  求均值，得到平均损失

# 克隆main_program得到test_program
test_program = fluid.default_main_program().clone(for_test=True)

#配置优化器（Optimizer Function）
sgd_optimezer = fluid.optimizer.Adam(learning_rate=0.001)
sgd_optimezer.minimize(avg_loss)


#配置运算场所
use_cuda = False
place = fluid.CUDAPlace(0) if use_cuda else fluid.CPUPlace()

# 创建执行器，初始化参数
exe = fluid.Executor(place)
exe.run(fluid.default_startup_program())    #启动模型
 #配置数据提供器
feeder = fluid.DataFeeder(place=place,feed_list=[x,y])
#配置Event Handler
train_prompt = "Train cost"
test_prompt = "Test cost"
cost_ploter = Ploter(train_prompt, test_prompt)

# 将训练过程绘图表示
def event_handler_plot(ploter_title, step, cost):
    cost_ploter.append(ploter_title, step, cost)
    cost_ploter.plot()
#创建训练过程
save_dirname = "lstm.inference.model"   # 将模型参数存储在名为 save_dirname 的文件中
num_epochs = 150
step = 0
for pass_id in range(num_epochs):
    #step = 0 # 画图用
    total_loss_pass = 0 #初始化每一个epoch的损失值初始值为0
    for data_train in train_reader():
        avg_loss_value = exe.run(program=fluid.default_main_program(),
                                  feed = feeder.feed(data_train),
                                  fetch_list = [avg_loss])
        total_loss_pass += avg_loss_value[0] #计算每个epoch的总损失值
    event_handler_plot(train_prompt, step, total_loss_pass)
    step += 1
    if pass_id % 10 == 0:
        print("%s,Pass %d, total avg cost = %f" % ( "train cost",pass_id, total_loss_pass))
   
     # 保存训练好的模型参数用于预测
    if save_dirname is not None:
        fluid.io.save_inference_model(save_dirname, ['x'], [prediction], exe)
def convert2LODTensor(temp_arr, len_list):
    temp_arr = np.array(temp_arr) 
    temp_arr = temp_arr.flatten().reshape((-1, 1))#把测试样本的array平坦化到一维数据的格式
    print(temp_arr.shape)
    return fluid.create_lod_tensor(
        data=temp_arr,
        recursive_seq_lens =[len_list],
        place=fluid.CPUPlace()
        )#返回：A fluid LoDTensor object with tensor data and recursive_seq_lens info

def get_tensor_label(mini_batch):  
    tensor = None
    labels = []
    temp_arr = []
    len_list = []
    for _ in mini_batch:    
        labels.append(_[1]) #收集 label----y 
        temp_arr.append(_[0]) #收集序列本身--x 
        len_list.append(len(_[0])) #收集每个序列x的长度,和上边x的维度对应，
    tensor = convert2LODTensor(temp_arr, len_list)    
    return tensor, labels
 
test_reader = paddle.batch(
    read_data(test_x,test_y),
    batch_size=test_size)#由于数据量不大，使得所有测试集数据为一个batch
#创建预测用的Executor
infer_exe = fluid.Executor(place)
inference_scope = fluid.core.Scope()

#使用验证集进行预测
with fluid.scope_guard(inference_scope):
    # 使用 fluid.io.load_inference_model 获取 inference program desc,
    # feed_target_names 用于指定需要传入网络的变量名
    # fetch_targets 指定希望从网络中fetch出的变量名
    [inference_program, 
     feed_target_names,
     fetch_targets] = fluid.io.load_inference_model(save_dirname, infer_exe)
    


    prediction = []
    labels = []
    for data_test in test_reader():
        tensor,label = get_tensor_label(data_test)# 转换成tensor格式的x和y
        results = infer_exe.run(inference_program,
                      feed= {'x':tensor},
                      fetch_list=fetch_targets)
        result_print = results[0].flatten()
        prediction.append(result_print)
        labels.append(label)
    
    plt.figure()
    labels = scaler.inverse_transform(labels)#标签转换回原始数据
    prediction = scaler.inverse_transform(prediction)#预测值转换回原始数据大小区间范围

    print("predictions")
    print("------------------")
    print(prediction)
    print("===========================")
    print("===========================")
    print("labels")
    print("----------------------")
    print(labels)

    plt.plot(list(range(len(labels[0]))), labels[0], color='r')  #红线为真实值
    plt.plot(list(range(len(prediction[0]))), prediction[0], color='g')  #绿线为预测值
    plt.show()

预测结果为：

我一开始以为是神经网络的层数不够，后来加了几层之后，训练结果跟现在没有什么区别，我觉得是标签有问题，但是我觉得代码也没有问题，有没有大佬帮忙解答一下，谢谢

绿色为预测值，红色为真实值

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
qq_46699884 2021-12-10 17:15
关注
解决了吗

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用LSTM做时间序列预测，图画的挺准，准确度怎么这么差，有大佬知道大概怎么回事吗 tensorflow 人工智能机器学习深度学习神经网络
2020-04-08 23:27

回答 1 已采纳你用的是不是metric里的acc？那个只能是分类，不能用于回归
LSTM预测车流量，出来的结果是一条直线，就开头有一点点波动，求教 tensorflow
2019-02-02 18:53

回答 1 已采纳一没有数据，二没有代码，三没有模型，四没有结果，谁知道你在说什么。你说的结果是直线是什么曲线是直线，横坐标是什么，纵坐标是什么。不知道你说的直线是什么直线，如果是预测N步数据，这些数据画出来是
PSO-LSTM时间序列预测模型在预测的时候Matlab每次运行结果不一样，该如何处理 lstm matlab 有问必答机器学习
2022-03-13 15:32

回答 2 已采纳可以设置随机数的种子，设置好后每次运行的结果就相同了，方法如下： rng(1) % 设置随机数种子为1 %% 然后开始随机数的取值操作计算
基于PaddlePaddle的LSTM神经网络实现中国人口预测
2022-12-15 11:30

AI Studio的博客 AI达人特训营第二期，依据中国人口逐年变化数据集，使用Paddle搭建LSTM神经网络，实现人口预测。项目流程包括数据预处理、模型构建、模型训练、模型预测、预测结果可视化等。
LSTM模型如何进行新数据的预测？ python 人工智能机器学习深度学习神经网络
2019-07-04 15:21

回答 2 已采纳创建一个预测数组，每预测一个Y就往数组里放一个，同时更新你用来预测的自变量X数组，剔除最早的X，把预测值加入到X里，依次往后预测
lstm时间序列预测过拟合问题 lstm python 有问必答
2021-09-16 20:21

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
关于LSTM预测的问题 lstm matlab 算法
2023-02-21 20:29

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这篇博客也许可以解决你的问题👉 ：LSTM如何解决梯度消失与梯度爆炸如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相
实战5：农作物产量预测蔬菜产量预测 lstm 完整代码数据-可直接运行-计算机毕设
2024-05-03 19:15

计算机毕设论文的博客实战5：农作物产量预测蔬菜产量预测 lstm 完整代码数据-可直接运行-计算机毕设
关于#lstm#的问题：lstm训练，padding 补0后,模型不收敛 lstm pytorch 时序数据库
2022-07-20 18:43

回答 2 已采纳直接划分60s滑动窗口不行嘛
如何使用LSTM和Transform等经典模型 lstm transformer 自然语言处理
2022-10-12 20:31

回答 1 已采纳建议换pytorch，信我，tensorflow坑巨多，还有各个版本之间的api兼容性，cuda兼容性巨差，旧版本的代码（1.08-1.15）在新版本（2.x）基本上跑不动,而一些旧的代码基本上都是1
使用Keras编写的LSTM，训练时出现loss: nan - val_loss: nan，该如何调整？ keras lstm 有问必答深度学习
2022-05-03 18:40

回答 2 已采纳原数据第一列是时间形式的20220503这种，在读数据之后进行下面操作，你的数据是简单的1 2 34这种，数据可能在处理过程丢失或者变成nan了，你可以一步步看看每次处理后当前的数据现在是什么格式 d
PaddleTS：在时间序列数据集上使用LSTM进行趋势预测
2022-11-06 20:23

AI Studio的博客使用PaddleTS模型库，在Jena Climate时间序列数据集上使用LSTM进行温度预测
keras下用RNN中的lstm来进行图片分类，输入维数的错误 python tensorflow 人工智能深度学习神经网络
2020-04-26 15:07

回答 1 已采纳 lstm做图片分类？一般来说CNN才用来做图片分类。 model.add(LSTM(units=nb_lstm_outputs, return_sequences=True,
baostock证券数据集下使用LSTM模型预测A股走势
2022-11-21 19:58

AI Studio的博客使用飞桨高层API在baostock证券数据集下构建LSTM模型预测A股走势
“AI Earth”人工智能创新挑战赛：助力精准气象和海洋预测Baseline[2]：数据探索性分析（温度风场可视化）、CNN+LSTM模型建模
2023-06-06 10:09

汀、人工智能的博客该方案在数据处理部分采用了滑窗来构造数据集，这是序列预测问题中常用的增加数据量的方法。另外，该方案中增加了一组月份特征，个人认为在时序场景中增加的这组特征收益不高，更多的是通过模型挖掘序列中的依赖关系...
没有解决我的问题, 去提问

悬赏问题

¥20 显示器休眠后重新唤醒出现蓝屏，蓝屏代码为DRIVER-POWER.STATE-FAILURE
¥20 alt+tab怎么恢复到以前的模式
¥15 来一个会抓包app支付链接的
¥15 MMdetection安装
¥15 STM32U535系列stop3模式进入和RTC唤醒
¥15 如何提取全民K歌没下载过但播放过很多次的音频？
¥15 树莓派运行detect.py
¥15 pdfplumber提起文本内容如何过滤水印内容
¥15 kingbase容器启动失败，sudo：/bin/sudo must be owned by uid 0 and have the setuid bit set
¥20 黑神话悟空调用机械硬盘导致卡顿

为什么用lstm做时序预测结果这么差（用paddlepaddle实现的）

2条回答 默认 最新

悬赏问题

2条回答默认最新