lstm实现过程中权值共享问题


class LSTMCell(nn.Module):
    def __init__(self, input_size, hidden_size, cell_size, output_size):
        super().__init__()
        self.hidden_size = hidden_size # 隐含状态h的大小，也即LSTM单元隐含层神经元数量
        self.cell_size = cell_size # 记忆单元c的大小
        # 门
        self.gate = nn.Linear(input_size+hidden_size, cell_size)
        self.output = nn.Linear(hidden_size, output_size)
        self.sigmoid = nn.Sigmoid()
        self.tanh = nn.Tanh()
        self.softmax = nn.LogSoftmax(dim=1)

    def forward(self, input, hidden, cell):
        # 连接输入x与h 
        combined = torch.cat((input, hidden), 1)
        # 遗忘门
        f_gate = self.sigmoid(self.gate(combined))
        # 输入门
        i_gate = self.sigmoid(self.gate(combined))
        z_state = self.tanh(self.gate(combined))
        # 输出门
        o_gate = self.sigmoid(self.gate(combined))
        # 更新记忆单元
        cell = torch.add(torch.mul(cell, f_gate), torch.mul(z_state, i_gate))
        # 更新隐藏状态h
        hidden = torch.mul(self.tanh(cell), o_gate)
        output = self.output(hidden)
        output = self.softmax(output)
        return output, hidden, cell
    
    def initHidden(self):
        return torch.zeros(1, self.hidden_size)

    def initCell(self):
        return torch.zeros(1, self.cell_size)

上述代码实现了LSTM单元，其中init方法中使用了self.gate，是不是存在三个门权值共享的问题?

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-09-21 18:56
关注
【以下回答由 GPT 生成】

是的，上述实现中存在三个门的权值共享问题。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

LSTM中关于数据匹配的问题 lstm python
2023-03-23 16:59

回答 8 已采纳基于Monster 组和GPT的调写：用LSTM模型来实现时间序列数据的相似度匹配 import numpy as np from keras.models import Sequential fr
lstm时间序列预测过拟合问题 lstm python 有问必答
2021-09-16 20:21

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，已经为您补发到账户，我们后续会持续优化，扩大我们的服务范围，为您带来更好地服务。
关于LSTM预测的问题 lstm matlab 算法
2023-02-21 20:29

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这篇博客也许可以解决你的问题👉 ：LSTM如何解决梯度消失与梯度爆炸如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相
LSTM参数问题——很多情况下LSTM中每个单元中的参数是相同的
2022-10-25 22:02

GIS跳闸的博客但事实上，相当多的情况下，包括网络上的大部分示例中，一个LSTM中每个单元共享相同的。一个完整的LSTM中可能有多个LSTM单元（Cell），每个单元接收一个时间步的输入。GRU、RNN大部分情况下也是这样。至少我网上找到...
深度学习LSTM的参数问题 lstm 深度学习神经网络
2023-03-07 11:00

回答 4 已采纳参考GPT和自己的思路，LSTM的参数W、U、b可以通过随机初始化或者预训练的方式获得。一般来说，W、U、b的维度和对应的输入和输出维度相关。在你给出的LSTM结构中，输入xt的大小是100，ht的
关于#LSTM#的问题，如何解决？ lstm 机器学习
2023-03-17 11:20

回答 5 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：根据您提供的代码，可以发现训练出来的 LSTM 模型在预测时的表现并不理想。在分析时需要注意以下几点：数据归一化由于 LSTM 模型的特点，输入
关于#lstm#的问题：lstm训练，padding 补0后,模型不收敛 lstm pytorch 时序数据库
2022-07-20 18:43

回答 2 已采纳直接划分60s滑动窗口不行嘛
如何从RNN起步，一步一步通俗理解LSTM
2019-05-06 23:47

v_JULY_v的博客如何从RNN起步，一步一步通俗理解LSTM 前言提到LSTM，之前学过的同学可能最先想到的是ChristopherOlah的博文《理解LSTM网络》，这篇文章确实厉害，网上流传也相当之广，而且当你看过了网上很多关于LSTM的文章...
LSTM模型训练过拟合问题。 python 人工智能深度学习神经网络
2020-09-15 10:21

回答 1 已采纳没办法，你的训练样本太少。增加训练样本是唯一的办法。好比吃不饱饭怎么办，不增加饭，采用稀饭掺水，少餐多顿这些办法都治标不治本。所以你看即便it大厂，也在拼命积攒数据以及人工标注数据，花费大
LSTM输入数据格式问题 batch lstm
2018-11-05 07:36

回答 2 已采纳 model.add(LSTM(50, input_shape=(train_x1.shape[1], train_x1.shape[2]))) -> model.add(LSTM(50, i
keras下用RNN中的lstm来进行图片分类，输入维数的错误 python tensorflow 人工智能深度学习神经网络
2020-04-26 15:07

回答 1 已采纳 lstm做图片分类？一般来说CNN才用来做图片分类。 model.add(LSTM(units=nb_lstm_outputs, return_sequences=True,
LSTM and BERT在文本分类中的代码
2023-08-13 17:12

YFY_13872233701的博客另外此篇博客的内容在我的课程设计中以计算机学报论文的格式中呈现，word不多只有4页，需要同样请自取Kaggle 是一个数据科学竞赛平台，也是一个社交网络，在该平台上你可以找到很多有趣的数据问题，可以和世界各地...
请问命名实体识别任务中如何在bilstm前加入embedding？ lstm nlp 自然语言处理
2022-01-17 21:39

回答 1 已采纳可以把BERT的Embedding层拿来用，也可以把BEET的输出视为embedding，也可以自己使用NN..Embedding定义一层Embedding层，自己进行训练
【模型架构】学习RNN、LSTM、TextCNN和Transformer以及PyTorch代码实现
2024-05-31 20:25

追风赶月。的博客本文将详细介绍这些经典的模型架构及其在PyTorch中的实现，由于我只是门外汉（想扩展一下知识面），如果有理解不到位的地方欢迎评论指正～。个人感觉NLP的任务本质上是一个序列到序列的过程，给定输入序列，要通过一...
人工智能课程设计：基于CNN和LSTM的MSTAR数据集分析与处理（python实训）
2024-03-09 21:52

bin bin bingo的博客在实验的最后通过对CNN和CNN+LSTM两种模型的对比分析，评估它们在MSTAR数据集上的性能差异，分析加入LSTM对实验最后结果的影响的原因。Loss曲线整体是向下降的一个趋势，并且最后是趋于稳定，说明整个模型的收敛效果...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月21日

悬赏问题

¥15 在网页上点击view PDF或者open PDF之类的选项加载很慢甚至加载不出来，换网或浏览器都不行
¥115 不能成功安装R语言pathview包
¥15 LEfSe在线分析Galaxy报错，如何解决？
¥15 GTEx数据库eqtl数据整理求教学
¥20 AI自瞄 KMBOXNET
¥15 初学者，自己写的js俄罗斯代码，谁能帮我调试并找出问题所在！！自己调试了好多遍！快乱了，崩溃了！
¥15 IEC61850库中IedServer_setControlHandler函数的作用
¥15 qt 编译webengine 支持 webgl
¥15 Cadence安装后pcb design可以打开，Capture CIS闪退
¥15 python中post报错

lstm实现过程中权值共享问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新