lstm输入数据维度问题

用tensorflow和源代码实现的，但是因为是参考着参考书写的，在传入自己的数据之后，数据维度方面有很大问题，麻烦大家看看

以下是我的数据维度：

传入时格式设置如下：

for e in range(epochs):
    print(f"-----Epoch_{e+1}-----")
    x_mb = np.zeros((figures_size, batch_size, window_size))
    for n, j in enumerate(range(n_batch)):
        print(f"-----batch {n+1}-----")
        x_mb_ori = x_train_ori[j*batch_size:(j+1)*batch_size]
        t_mb,flag = get_t(x_mb_ori, y_train[j*batch_size:(j+1)*batch_size])

lstm模型forward部分定义如下：

class LSTMLayer:
    def __init__(self, n_upper, n):
        #各项参数的初始值
        self.w = np.random.randn(4, n_upper, n)/np.sqrt(n_upper)
        self.v = np.random.randn(4, n, n)/np.sqrt(n)
        self.b = np.zeros((4, n))

    def forward(self, x, y_prev, c_prev):
        #y_prev,c_prev：前一时刻的输出数据和记忆单元
        u = np.matmul(x, self.w)+np.matmul(y_prev, self.v)+self.b.reshape(4,1,-1)

        a0 = sigmoid(u[0])           #忘记门
        a1 = sigmoid(u[1])           #输入门
        a2 = np.tanh(u[2])           #新的记忆
        a3 = sigmoid(u[3])           #输出门
        self.gates = np.stack((a0,a1,a2,a3))
        self.c = a0*c_prev + a1*a2          #记忆单元
        self.y = a3 * np.tanh(self.c)       #输出数据

请问我该怎么修改以下内容（应该主要是数据维度方面）保证我的数据传入模型并且能够正确运行呐？

#初始化LSTM
InputLayers = [LSTMLayer(window_size, n_mid)] * figures_size
DenseLayers = [LSTMLayer(n_mid, n_mid),OutputLayer(n_mid, n_out)]

#LSTM正向传播
def forward_propagation(x_figures):
    x_lst = [] 
    x_rnn = np.zeros((len(x_figures), figures_size+1, n_mid))
    y_rnn = np.zeros((len(x_figures), figures_size+1, n_mid))
    c_rnn = np.zeros((len(x_figures), figures_size+1, n_mid))
    gates_rnn = np.zeros((4, len(x_figures), figures_size, n_mid))
    y_prev = y_rnn[:, 0,:]
    c_prev = c_rnn[:, 0,:]
    for i, layer in enumerate(InputLayers):
        layer.forward(x_figures[:, i, :], y_prev, c_prev)
        x_lst.append(layer.y)
        x_rnn[ :, i, :] = layer.y
        
        y = layer.y
        y_rnn[:, i+1,:] = y
        y_prev = y
        
        c = layer.c
        c_rnn[:, i+1,:] = c
        c_prev = c
        
        gates = layer.gates
        gates_rnn[:, :, i,:] = gates
        
        
    #x = np.concatenate(x_lst, axis=1)
    y_prev = y_rnn
    c_prev = c_rnn
    for layer in DenseLayers:
        layer.forward(x_rnn,y_prev,c_prev)
        x = layer.y
    return x

按现在的设置报错如下：

ValueError                                Traceback (most recent call last)
Cell In[15], line 15
     13 if flag:
     14     true.append(t_mb)
---> 15     p = forward_propagation(x_mb)
     16     pred.append(p)
     17     backpropagation(x_mb, t_mb)

Cell In[13], line 52, in forward_propagation(x_figures)
     50 c_prev = c_rnn
     51 for layer in DenseLayers:
---> 52     layer.forward(x_rnn,y_prev,c_prev)
     53     x = layer.y
     54 return x

File ~/Gushuai/LSTM-Transformers/py_file/LSTM.py:15, in LSTMLayer.forward(self, x, y_prev, c_prev)
     13 def forward(self, x, y_prev, c_prev):
     14     #y_prev,c_prev：前一时刻的输出数据和记忆单元
---> 15     u = np.matmul(x, self.w)+np.matmul(y_prev, self.v)+self.b.reshape(4,1,-1)
     17     a0 = sigmoid(u[0])           #忘记门
     18     a1 = sigmoid(u[1])           #输入门

ValueError: matmul: Input operand 1 has a mismatch in its core dimension 0, with gufunc signature (n?,k),(k,m?)->(n?,m?) (size 16 is different from 32)

有哪位神人可以帮帮我吗谢谢🥹

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Kwan的解忧杂货铺@新空间代码工作室 2024-03-13 23:10
关注
m0_74946741 晚上好🌙🌙🌙
本答案参考ChatGPT-3.5

根据你提供的代码和报错信息看，有以下几个问题需要解决：

数据维度匹配问题： 根据报错信息，可以看出在LSTMLayer的forward函数中，涉及到x、y_prev、self.w和self.v之间的矩阵乘法，维度不匹配导致报错。你需要确保传入forward函数的x和y_prev的维度与self.w和self.v的维度匹配。

LSTMLayer的初始化问题： 在初始化LSTMLayer时，你使用了以下代码：

InputLayers = [LSTMLayer(window_size, n_mid)] * figures_size DenseLayers = [LSTMLayer(n_mid, n_mid),OutputLayer(n_mid, n_out)]

这种方式将第一个LSTMLayer的实例复制了figures_size次，这样会导致每个InputLayer都共享相同的权重，可能会导致结果不正确。你可以改为使用循环来创建不同的LSTMLayer实例。

解决方案如下：

检查数据维度是否匹配，确保传入forward函数的x和y_prev的维度与self.w和self.v的维度匹配。

修改LSTMLayer的初始化部分，确保每个InputLayer都是一个独立的实例。代码示例如下：

InputLayers = [] for _ in range(figures_size): InputLayers.append(LSTMLayer(window_size, n_mid)) DenseLayers = [LSTMLayer(n_mid, n_mid),OutputLayer(n_mid, n_out)]

希望以上解决方案对你有帮助！如果还有其他问题，请继续追问。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

LSTM输入数据格式问题 batch lstm
2018-11-05 07:36

回答 2 已采纳 model.add(LSTM(50, input_shape=(train_x1.shape[1], train_x1.shape[2]))) -> model.add(LSTM(50, i
LSTM中关于数据匹配的问题 lstm python
2023-03-23 16:59

回答 8 已采纳基于Monster 组和GPT的调写：用LSTM模型来实现时间序列数据的相似度匹配 import numpy as np from keras.models import Sequential fr
LSTM模型可以训练怎样的数据集？人工智能深度学习神经网络自然语言处理
2020-04-18 17:08

回答 1 已采纳 LSTM主要用来学习序列，并且序列的变化的影响因子和序列本身有关或者周期性波动。比如说文本预测，每天每周每年的销量别的也可以学，但是效果未必很好。
CNN-LSTM Matlab源码，包括原数据
2022-02-10 17:18

池化层则用于降低数据维度，提高计算效率，同时保持关键信息；激活函数如ReLU（修正线性单元）能引入非线性，使模型具有更强的表达能力。在Matlab中，`conv2d`和`maxpool2d`函数可实现这些操作。 **LSTM部分** ...
关于LSTM预测的问题 lstm matlab 算法
2023-02-21 20:29

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这篇博客也许可以解决你的问题👉 ：LSTM如何解决梯度消失与梯度爆炸如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相
关于LSTM模型提取数据特征 tensorflow 人工智能深度学习自然语言处理
2020-04-24 23:35

回答 1 已采纳用fit训练，用predict预测－－－－－－－－－－－－－－－－－－－－－－－－－－－本来还想多说几句的，一看之前的回答都没有采纳。当我白说
深度学习LSTM的参数问题 lstm 深度学习神经网络
2023-03-07 11:00

回答 4 已采纳参考GPT和自己的思路，LSTM的参数W、U、b可以通过随机初始化或者预训练的方式获得。一般来说，W、U、b的维度和对应的输入和输出维度相关。在你给出的LSTM结构中，输入xt的大小是100，ht的
MATLAB实现LSTM神经网络多输入单输出预测
2024-01-09 18:24

1. **数据预处理**：首先，你需要将你的多输入数据集整理成适合LSTM的格式。这可能包括标准化、归一化以及将数据分割为训练集、验证集和测试集。 2. **创建LSTM网络**：使用`lstmLayer`函数创建LSTM层，指定输入...
LSTM模型如何进行新数据的预测？ python 人工智能机器学习深度学习神经网络
2019-07-04 15:21

回答 2 已采纳创建一个预测数组，每预测一个Y就往数组里放一个，同时更新你用来预测的自变量X数组，剔除最早的X，把预测值加入到X里，依次往后预测
关于#lstm#的问题：lstm训练，padding 补0后,模型不收敛 lstm pytorch 时序数据库
2022-07-20 18:43

回答 2 已采纳直接划分60s滑动窗口不行嘛
lstm时间序列预测过拟合问题 lstm python 有问必答
2021-09-16 20:21

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
LSTM 一维输入
2024-05-24 01:05

skytelling的博客实现过程很简单，下面附带码，数据集是从下载的代码参考本文主要是分享自己遇到的一些问题以及本段代码里面学到的东西。
LSTM神经网络模型张量与变量维度不匹配 lstm python tensorflow
2023-04-03 17:51

回答 3 已采纳与之前模型的checkpoint路径重合，新建一个路径保存即可
PyTorch框架的中LSTM的输入和输出
2023-11-02 09:12

小维_的博客 input_size:输入数据的特征维度，（单变量=1,embedding=【词向量的表示维度】）hidden_size:LSTM隐层的维度num_layers:循环神经网络的层数 1或者2batch_first:通常默认为False，输入的数据shape=(time_steps,batch_...
Pytorch中的LSTM输入格式
2020-03-31 21:47

QiaoDog的博客之前写的代码，由于搞错了 LSTM 输入的格式，导致我写的代码虽然可以运行，但是运行的结果却是错误的，而且还很难发现。直到我查看了文档和官方的样例，才发现正确的输入方式是怎么样的。 class torch.nn.LSTM(*...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月13日

悬赏问题

¥15 单纯型python实现编译报错
¥15 c++2013读写oracle
¥15 c++ gmssl sm2验签demo
¥15 关于模的完全剩余系(关键词-数学方法)
¥15 有没有人懂这个博图程序怎么写，还要跟SFB连接，真的不会，求帮助
¥15 PVE8.2.7无法成功使用a5000的vGPU，什么原因
¥15 is not in the mmseg::model registry。报错，模型注册表找不到自定义模块。
¥15 安装quartus II18.1时弹出此error，怎么解决？
¥15 keil官网下载psn序列号在哪
¥15 想用adb命令做一个通话软件，播放录音

lstm输入数据维度问题

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新