请教LSTM遗忘门的实现问题

请教一个关于LSTM的问题。lstm的实现中，遗忘门的输入为上一时刻h和本次x，这两个张量到底是应该先torch.cat再做加权运算呢，还是应该每个张量分别加权再相加呢？

参考相关描述，x和h进行concatenate操作，然而h和x是不共享权值的，如果先做cat操作的话，那不是共享权值了吗？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Andy_shenzl 人工智能领域优质创作者 2023-09-15 11:54
关注
在LSTM（长短时记忆网络）的实现中，遗忘门的输入通常是上一时刻的隐藏状态（h）和当前时刻的输入（x）的元素级组合，然后再进行加权运算。

具体来说，通常是先将上一时刻的隐藏状态（h）和当前时刻的输入（x）按元素级别进行连接（concatenate），然后将连接后的结果输入到一个全连接层（或称为线性层）中，以计算遗忘门的输出。这个全连接层会有权重矩阵和偏置项，用来学习如何加权这两个输入。

所以，整个流程可以概括为以下步骤：

将上一时刻的隐藏状态（h）和当前时刻的输入（x）按元素级别连接（concatenate）起来。
将连接后的结果输入到一个全连接层，该全连接层具有权重矩阵和偏置项。
全连接层的输出经过一个激活函数（通常是sigmoid函数）以产生遗忘门的输出。
这种方式可以让模型学习如何同时考虑上一时刻的信息和当前时刻的输入，以确定需要遗忘多少上一时刻的信息。这正是LSTM网络的一个关键特性，使其能够有效地处理长序列依赖关系。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于LSTM预测的问题 lstm matlab 算法
2023-02-21 20:29

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这篇博客也许可以解决你的问题👉 ：LSTM如何解决梯度消失与梯度爆炸如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相
LSTM输入数据格式问题 batch lstm
2018-11-05 07:36

回答 2 已采纳 model.add(LSTM(50, input_shape=(train_x1.shape[1], train_x1.shape[2]))) -> model.add(LSTM(50, i
深度学习LSTM的参数问题 lstm 深度学习神经网络
2023-03-07 11:00

回答 4 已采纳参考GPT和自己的思路，LSTM的参数W、U、b可以通过随机初始化或者预训练的方式获得。一般来说，W、U、b的维度和对应的输入和输出维度相关。在你给出的LSTM结构中，输入xt的大小是100，ht的
lstm网络三门之遗忘门
2023-11-03 09:26

AI_dataloads的博客 LSTM的遗忘门主要用于控制前一个时间步的记忆细胞（cell state）中哪些信息需要被遗忘或保留。遗忘门的输入包括当前时间步的输入（(x_t)）和前一个时间步的隐藏状态（(h_{t-1})），输出是一个介于0和1之间的向量，...
lstm时间序列预测过拟合问题 lstm python 有问必答
2021-09-16 20:21

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
关于#LSTM#的问题，如何解决？ lstm 机器学习
2023-03-17 11:20

回答 5 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：根据您提供的代码，可以发现训练出来的 LSTM 模型在预测时的表现并不理想。在分析时需要注意以下几点：数据归一化由于 LSTM 模型的特点，输入
LSTM中关于数据匹配的问题 lstm python
2023-03-23 16:59

回答 8 已采纳基于Monster 组和GPT的调写：用LSTM模型来实现时间序列数据的相似度匹配 import numpy as np from keras.models import Sequential fr
LSTM_LSTM的matlab实现_lstm代码_LSTM_lstmmatlab_matlablstm
2021-09-11 13:05

46数据集为官方数据集；代码略有修改；注：训练集和测试集一定为元胞数组
LSTM模型训练过拟合问题。 python 人工智能深度学习神经网络
2020-09-15 10:21

回答 1 已采纳没办法，你的训练样本太少。增加训练样本是唯一的办法。好比吃不饱饭怎么办，不增加饭，采用稀饭掺水，少餐多顿这些办法都治标不治本。所以你看即便it大厂，也在拼命积攒数据以及人工标注数据，花费大
关于#lstm#的问题：lstm训练，padding 补0后,模型不收敛 lstm pytorch 时序数据库
2022-07-20 18:43

回答 2 已采纳直接划分60s滑动窗口不行嘛
matlab2018运行pso-lstm时出现以下问题不知道怎么解决 lstm 深度学习神经网络
2023-03-18 10:26

回答 3 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ根据报错信息，问题出在使用具有LSTM层的网络进行验证数据训练上。Matlab 2018版的trainNetwork函数可能不支持这种方式。建议尝试以下解决方案：禁用验证
GA-LSTM 遗传算法优化的lstm 预测代码 python实现
2022-04-07 15:11

LSTM单元包含输入门、遗忘门和输出门，这些门结构允许网络在长期依赖性中存储和检索信息。遗传算法在LSTM中的应用主要目标是优化模型的参数，例如权重和偏置，以提升模型的预测性能。实现步骤通常包括以下部分： ...
pytorch搭建的cnn-lstm的Tensor问题 cnn python pytorch
2022-10-19 08:47

回答 1 已采纳你看下这篇博客吧, 应该有用👉 ：pytorch+cnn+lstm+词向量
人工智能(Pytorch)搭建模型2-LSTM网络实现简单案例
2023-03-15 14:24

微学AI的博客 LSTM中的关键组成部分是门控机制，它允许网络选择性地丢弃或保留信息。在训练过程中，LSTM网络通过反向传播算法自动调整门控单元的参数，使其能够更好地适应数据。PyTorch是一个基于Python的深度学习框架，提供了...
基于LSTM的情感分析程序实现源码
2024-03-21 14:41

传统的循环神经网络（RNN）在处理长序列时存在问题，而引入了记忆细胞、输入门、输出门和遗忘门的LSTM模型能够有效解决这一问题。数据集和预处理在机器学习和自然语言处理任务中也扮演着重要角色，对数据进行清洗和...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月15日

悬赏问题

¥15 鼠标右键，撤销删除复制移动，要怎样删除
¥15 使用MATLAB进行余弦相似度计算加速
¥15 服务器安装php5.6版本
¥15 我想用51单片机和数码管做一个从0开始的计数表我写了一串代码但是放到单片机里面数码管只闪烁一下然后熄灭
¥20 系统工程中，状态空间模型中状态方程的应用。请猛男来完整讲一下下面所有问题
¥15 我想在WPF的Model Code中获取ViewModel Code中的一个参数
¥15 arcgis处理土地利用道路建筑林地分类
¥20 使用visual studio 工具用C++语音，调用openslsx库读取excel文件的sheet问题
¥100 寻会做云闪付tn转h5支付链接的技术
¥15 DockerSwarm跨节点无法访问问题

请教LSTM遗忘门的实现问题

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新