jekufledo@ 2023-09-15 11:15 采纳率: 0%
浏览 14

请教LSTM遗忘门的实现问题

请教一个关于LSTM的问题。lstm的实现中,遗忘门的输入为上一时刻h和本次x,这两个张量到底是应该先torch.cat再做加权运算呢,还是应该每个张量分别加权再相加呢?

img


参考相关描述,x和h进行concatenate操作,然而h和x是不共享权值的,如果先做cat操作的话,那不是共享权值了吗?

  • 写回答

2条回答 默认 最新

  • Andy_shenzl 人工智能领域优质创作者 2023-09-15 11:54
    关注

    在LSTM(长短时记忆网络)的实现中,遗忘门的输入通常是上一时刻的隐藏状态(h)和当前时刻的输入(x)的元素级组合,然后再进行加权运算。

    具体来说,通常是先将上一时刻的隐藏状态(h)和当前时刻的输入(x)按元素级别进行连接(concatenate),然后将连接后的结果输入到一个全连接层(或称为线性层)中,以计算遗忘门的输出。这个全连接层会有权重矩阵和偏置项,用来学习如何加权这两个输入。

    所以,整个流程可以概括为以下步骤:

    将上一时刻的隐藏状态(h)和当前时刻的输入(x)按元素级别连接(concatenate)起来。
    将连接后的结果输入到一个全连接层,该全连接层具有权重矩阵和偏置项。
    全连接层的输出经过一个激活函数(通常是sigmoid函数)以产生遗忘门的输出。
    这种方式可以让模型学习如何同时考虑上一时刻的信息和当前时刻的输入,以确定需要遗忘多少上一时刻的信息。这正是LSTM网络的一个关键特性,使其能够有效地处理长序列依赖关系。

    评论

报告相同问题?

问题事件

  • 创建了问题 9月15日

悬赏问题

  • ¥15 鼠标右键,撤销删除 复制 移动,要怎样删除
  • ¥15 使用MATLAB进行余弦相似度计算加速
  • ¥15 服务器安装php5.6版本
  • ¥15 我想用51单片机和数码管做一个从0开始的计数表 我写了一串代码 但是放到单片机里面数码管只闪烁一下然后熄灭
  • ¥20 系统工程中,状态空间模型中状态方程的应用。请猛男来完整讲一下下面所有问题
  • ¥15 我想在WPF的Model Code中获取ViewModel Code中的一个参数
  • ¥15 arcgis处理土地利用道路 建筑 林地分类
  • ¥20 使用visual studio 工具用C++语音,调用openslsx库读取excel文件的sheet问题
  • ¥100 寻会做云闪付tn转h5支付链接的技术
  • ¥15 DockerSwarm跨节点无法访问问题