Keras LSTM 输入数据维度与模型要求不符

我是想用LSTM做个时序数据的多分类问题，最终目标类别有三种
先放一下数据结构和报错代码

X_train, X_test, Y_train, Y_test (3449, 64, 9) (1699, 64, 9) (3449, 1) (1699, 1)
y_train, y_test (3449, 3) (1699, 3)          #经过one_hot转变了一下

#报错内容
#WARNING:tensorflow:Model was constructed with shape (None, 64) for input KerasTensor(type_spec=TensorSpec(shape=(None, 64), dtype=tf.float32, name='embedding_17_input'), name='embedding_17_input', description="created by layer 'embedding_17_input'"), but it was called on an input with incompatible shape (None, 64, 9).

X_train的数据样式如下：

print(X_train)
[[[-1.20000000e-02  8.90000000e-02 -6.50000000e-02 ... -5.65103125e-01
    1.01594729e+00 -1.30111378e+00]
  [-3.50000000e-02  9.40000000e-02 -7.00000000e-02 ... -6.28892400e-01
    8.63049905e-01 -1.29727921e+00]
  [-2.60000000e-02  8.60000000e-02 -5.90000000e-02 ... -6.53028518e-01
    8.31202442e-01 -1.29352155e+00]
  ...
  [-1.00000000e-02 -1.70000000e-02 -1.10000000e-02 ... -6.14332537e-01
   -9.90024734e-01 -1.32757610e+00]
  [-4.00000000e-03 -1.40000000e-02 -4.00000000e-03 ... -6.13891972e-01
   -9.88219437e-01 -1.33221045e+00]
  [-1.30000000e-02 -1.30000000e-02  0.00000000e+00 ... -6.11675136e-01
   -9.60667708e-01 -1.38080713e+00]]

 ...

 [[-4.40000000e-02  3.00000000e-03  0.00000000e+00 ...  1.03778140e+00
    3.10468117e-01  8.45172798e-01]
  [-1.80000000e-02  8.00000000e-03  1.10000000e-02 ...  1.15684726e+00
    3.61290484e-01  8.35110613e-01]
  [-2.70000000e-02 -3.00000000e-03 -4.00000000e-03 ...  1.19378916e+00
    3.73164160e-01  8.17015112e-01]
  ...
  [-2.70000000e-02 -3.50000000e-02  4.00000000e-03 ...  7.82883921e-01
    1.37620405e+00  6.17715226e-01]
  [-1.80000000e-02 -3.30000000e-02 -2.00000000e-03 ...  7.76200044e-01
    1.34245390e+00  6.07810177e-01]
  [-1.30000000e-02 -3.30000000e-02 -9.00000000e-03 ...  7.70533406e-01
    1.29560074e+00  6.04281932e-01]]]

我的代码如下所示，刚开始学习，写的不好请见谅：

import tensorflow as tf
import os
from tensorflow import keras
import numpy as np
import _pickle as cPickle
from sklearn.model_selection import train_test_split

#超参数设置
n_steps = 64           #时间窗口内的数据行数
n_hidden = 100         #隐藏层的神经元数，隐藏层输出h的维数
n_classes = 3          #最终分类类别数量
learning_rate = 0.0025     #学习速度
n_inputs = 9            #每个step内的数据维度，当前实验内为9个，即paper中选取的9个数据维度
training_epochs = 2000     #整个数据集历遍次数
batch_size = 1500          #单次迭代训练样本数

#定义LSTM模型
'''
        1. embedding()函数为结构的第一层，规定了输入数据后转化的shape，输出结果为(None, 64, 100)，在原paper中时间窗口的size为64，初始的隐藏层h的维数为100
        2. SpatialDropout1D与Dropout的形式不太一样，后者为随机关闭20%的神经元，前者为关闭总量为20%的区域
        3. 原paper为两层LSTM结构，所以写了两个LSTM的cell,需要在第一个cell中声明，recurrent_activation = 'relu'即为在cell内的循环激活函数为'relu',
        函数的目的是，将输入小于0的值幅值为0，输入大于0的值不变，以及return_sequences = True,目的是将第一个LSTM Cell的输出作为第二个Cell的输入，且
        shape与第一层（embedding层）输出的保持一致，而第二个Cell的return_sequences = False，是因为这一层的输出是要接到全连接层根据激活函数给出output
        4. use_bias = 'True'表示LSTM的计算方式为WX+B，默认也是True，可以省略
        5. unit_forget_bias = 'True'在初始情况下C的状态为全保留，True对应Tensorflow1中的forget_bias = 1的情况，即全都不遗忘
        6. dropout和recurrent_dropout与上述的drop类似，均是防止过拟合情况出现
        7. Dense()因为前面已经定义过输入的shape，所以这里不需要定义了，驾驶行为分为3类(n_class)，因为是多分类问题，所以激活函数选择softmax
        8. compile()在原paper中已经说到使用Adam进行优化，而激活函数选择的softmax，多分类问题选择的损失函数为分类-交叉熵函数，categorical_crossentropy
        对于metrics参数来讲，独热码就是one_hot，y和y_都是数值 ‘accuracy’，y_和y都是独热码（概率分布y)使用 ‘categorical_accuracy’，
        y_是数值，y是独热码（概率分布）则使用 ‘sparse_categorical_accuracy’
'''
def lstm_model():
    model = tf.keras.Sequential([ 
        keras.layers.Embedding(input_dim = n_inputs, output_dim = n_hidden, input_length = n_steps),
        keras.layers.SpatialDropout1D(0.2),
        keras.layers.LSTM(n_hidden, use_bias = 'True', unit_forget_bias = 'True', dropout = 0.2, recurrent_dropout = 0.2, recurrent_activation = 'relu',return_sequences = True),
        keras.layers.LSTM(n_hidden, return_sequences = False),
        keras.layers.Dense(n_classes, activation='softmax')
    ])
    model.compile(  #使用model.compile()方法来配置训练方法
    optimizer = tf.keras.optimizers.Adam(learning_rate = learning_rate), #使用Adam优化器，学习率为0.0025
    loss = 'categorical_crossentropy', #配置损失函数
    metrics = ['‘sparse_categorical_accuracy’'] 
    )
    return model

model = lstm_model()  
model.summary()


def one_hot(y_):
    y_ = y_.reshape(len(y_))
    n_values = np.max(y_) + 1
    return np.eye(n_values)[np.array(y_, dtype=np.int32)]  # Returns FLOATS,np.eye()转化为one_hot数组

#定义数据导入
def load_motorway_dataset(data_path='data'):
    # Function to load the motorway dataset only 
    #open()中的'rb'代表着以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等
    with open(os.path.join(data_path, 'motorway_dataset_window_64_proc_veh_DtA.pkl'), 'rb') as f:
        save = cPickle.load(f, encoding='bytes')
        dt = {}
        #从print(data)看键的名称分别是b'labels', b'dataset'，而引用时用的dataset,labels，名称不一样，所以没有找到对应的键。需要对data的键decode一下
        for k,v in save.items():
            dt.update({k.decode():v})
        motorway_dataset = dt['dataset']
        motorway_labels = dt['labels']
        del save
        del dt
        print('Motorway set', motorway_dataset.shape, motorway_labels.shape)
    
    X_train, X_test, y_train, y_test = train_test_split(motorway_dataset, motorway_labels, test_size=0.33, random_state=42)

    return X_train, X_test, y_train, y_test


def load_secondary_dataset(data_path='data'):
    # Function to load the secondary dataset only 

    with open(os.path.join(data_path,'secondary_dataset_window_64_proc_veh_DtA.pkl'), 'rb') as f:
        save = cPickle.load(f, encoding='bytes')
        dt = {}
        for k,v in save.items():
            dt.update({k.decode():v})
        secondary_dataset = dt['dataset']
        secondary_labels = dt['labels']
        del save
        del dt
        print('Secondary set', secondary_dataset.shape, secondary_labels.shape)

    X_train, X_test, y_train, y_test = train_test_split(secondary_dataset, secondary_labels, test_size=0.33, random_state=42)
    
    return X_train, X_test, y_train, y_test


def load_full_dataset(data_path='data'):
    # Function to load the full dataset (motorway+secondary roads)

    with open(os.path.join(data_path, 'motorway_dataset_window_64_proc_veh_DtA.pkl'), 'rb') as f:
        save = cPickle.load(f, encoding='bytes')
        dt = {}
        for k,v in save.items():
            dt.update({k.decode():v})
        motorway_dataset = dt['dataset']
        motorway_labels = dt['labels']
        del save
        del dt
        print('Motorway set', motorway_dataset.shape, motorway_labels.shape)

    with open(os.path.join(data_path,'secondary_dataset_window_64_proc_veh_DtA.pkl'), 'rb') as f:
        save = cPickle.load(f, encoding='bytes')
        dt = {}
        for k,v in save.items():
            dt.update({k.decode():v})
        secondary_dataset = dt['dataset']
        secondary_labels = dt['labels']
        del save
        del dt
        print('Secondary set', secondary_dataset.shape, secondary_labels.shape)

    dataset = np.concatenate((motorway_dataset,secondary_dataset), axis=0)
    labels = np.concatenate((motorway_labels,secondary_labels), axis=0)

    X_train, X_test, y_train, y_test = train_test_split(dataset, labels, test_size=0.33, random_state=42)
    

    return X_train, X_test, y_train, y_test

#载入数据
'''
    载入全部数据
    X_train, X_test, y_train, y_test = load_full_dataset()
    载入高速公路数据
    X_train, X_test, y_train, y_test = load_motorway_dataset()
    载入二级道路数据
    X_train, X_test, y_train, y_test = load_secondary_dataset()
    查看是否有空值
    np.isnan(X_test).sum()
'''
X_train, X_test, Y_train, Y_test = load_motorway_dataset()
print('X_train, X_test, Y_train, Y_test',X_train.shape, X_test.shape, Y_train.shape, Y_test.shape)

#将labels转为one_hot独热编码,与分类列别数对应上，原labels二位数组为[xxx,1]，转化后为[xxx,3]
Y_train = one_hot(Y_train)
Y_test = one_hot(Y_test)
print('Y_train, Y_test', Y_train.shape, Y_test.shape)

callback = tf.keras.callbacks.EarlyStopping(monitor='val_loss',min_delta=0.0001, patience=10, restore_best_weights=True)   
history = model.fit(X_train, Y_train, epochs = training_epochs, batch_size = batch_size, validation_split=0.1, callbacks=[callback])

目前的问题就是输入数据格式不匹配，我尝试用下面的方法解决，但是又报错说Y的样本格式不匹配，烦请帮忙解决一下，谢谢。


X_train = tf.reshape(X_train,[len(X_train),-1])
X_test = tf.reshape(X_test,[len(X_test),-1])

#报错的形式内容：Can not squeeze dim[1], expected a dimension of 1, got 3 for '{{node Squeeze}} = Squeeze[T=DT_FLOAT, squeeze_dims=[-1]](IteratorGetNext:1)' with input shapes: [?,3].

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
有问必答小助手 2021-09-28 14:36
关注
你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答

本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

LSTM输入数据格式问题 batch lstm
2018-11-05 07:36

回答 2 已采纳 model.add(LSTM(50, input_shape=(train_x1.shape[1], train_x1.shape[2]))) -> model.add(LSTM(50, i
keras模型训练输出和测试输出数据维度不一致 keras python 神经网络
2023-02-23 17:17

回答 2 已采纳试下这样：predict2 = model.predict(Xtrain)print(predict2.shape)看下是否训练数据也一样
keras怎么改输入的维度 keras 机器学习神经网络
2019-04-10 22:04

回答 1 已采纳可以先reshape成40000,1152 也就是输入数据40000条，输入维度1152 然后用Dense层，可以用一个也可以用多个，最后输出到8 本质上你这个属于降维，也可以google下gi
Keras LSTM实现多维输入输出时序预测实践详解
2021-03-09 21:32

肖永威的博客自古以来，我们就希望预知未来，现如今，随着大数据人工智能技术的发展，我们早已经不满足传统的...深度学习神经网络为我们提供较为通用的解决方案，我们将在这里实践基于Python Keras LSTM多维输入输出时序预测模型。
LSTM神经网络模型张量与变量维度不匹配 lstm python tensorflow
2023-04-03 17:51

回答 3 已采纳与之前模型的checkpoint路径重合，新建一个路径保存即可
keras下用RNN中的lstm来进行图片分类，输入维数的错误 python tensorflow 人工智能深度学习神经网络
2020-04-26 15:07

回答 1 已采纳 lstm做图片分类？一般来说CNN才用来做图片分类。 model.add(LSTM(units=nb_lstm_outputs, return_sequences=True,
keras框架的数据输入维度问题深度学习神经网络
2020-05-27 12:14

回答 1 已采纳 https://blog.csdn.net/xiaohuihui1994/article/details/83536752
Keras LSTM教程
2019-10-20 17:10

rongchengluoye的博客本文原登载在极客教程的深度学习专栏：http://geek-docs.com/deep-learning/rnn/keras-lstm-tutorial.html ...5 构建Keras LSTM模型 6 创建Keras LSTM数据生成器 7 创建Keras LSTM结构 8 编译并运行Ker...
使用Keras编写的LSTM，训练时出现loss: nan - val_loss: nan，该如何调整？ keras lstm 有问必答深度学习
2022-05-03 18:40

回答 2 已采纳原数据第一列是时间形式的20220503这种，在读数据之后进行下面操作，你的数据是简单的1 2 34这种，数据可能在处理过程丢失或者变成nan了，你可以一步步看看每次处理后当前的数据现在是什么格式 d
tensorflow.keras训练模型预测问题 keras python tensorflow
2023-03-04 11:08

回答 2 已采纳这种情况可能是由于模型在训练过程中出现了过拟合的现象。过拟合通常是指模型在训练集上表现很好，但在测试集上表现不佳的情况。在训练过程中，模型过度适应了训练集的噪声和特定的样本，从而导致了 val_los
找的lstm模型里没有学习率这个参数 python
2021-07-21 10:15

回答 2 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 请看👉 ：深度学习-利用LSTM预测多输出如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
使用keras里面的lstm进行时间序列预测_【重温序列模型】再回首DeepLearning遇见了LSTM和GRU...
2020-11-23 21:13

weixin_39814378的博客昵称 | Miracle8070研究 | 时空序列预测与数据挖掘出品 | AI蜗牛车1. 写在前面学习时空序列，会需要很多序列模型的相关知识，所以借着这次机会想重新学习一下深度学习里面的序列模型模块，并做一个知识的梳理，主要...
keras训练卷积神经网络模型总是中断，发生未知错误 keras 机器学习深度学习
2021-11-15 18:25

回答 2 已采纳更新下pillow看看，如果还是这样，这张图片有问题，要么是你直接改的后缀而不是通过转换，要么是这种图已经损坏了，无法读取了
keras LSTM参数详解和LSTM相关知识
2020-08-23 13:14

人工智能（篮球方向）的博客 keras.layers.recurrent.LSTM(units, activation='tanh', recurrent_activation='hard_sigmoid', use_bias=True, kernel_initializer='glorot_uniform', recurrent_initializer='orthogonal', bias_initializer='...
【深度学习】图文并茂！用Keras LSTM构建编码器-解码器模型
2020-11-23 11:00

风度78的博客原文链接：https://towardsdatascience.com/how-to-build-an-encoder-decoder-translation-model-using-lstm-with-python-and-keras-a31e9d864b9b 往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月27日

悬赏问题

¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮

Keras LSTM 输入数据维度与模型要求不符

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新