RNN 展开实现LSTM按时间步迭代时，有必要令reuse=true么

我看到很多样例代码中，展开实现LSTM按时间步迭代时，都如下加上了一句
if timestep > 0:
tf.get_variable_scope().reuse_variables()

with tf.variable_scope('RNN'):
    for timestep in range(timestep_size):
        if timestep > 0:
            tf.get_variable_scope().reuse_variables()
        # 这里的state保存了每一层 LSTM 的状态
        (cell_output, state) = mlstm_cell(X[:, timestep, :], state)

我查了各类RNNCELL类的源代码，发现除了call函数外，还有build函数（此函数似乎是在创建所有的变量），且此函数只调用一次，并且是在call调用之前调用，并且查看源码注释时发现是这样写的：
For backwards compatibility purposes, most RNNCell instances allow their call methods to instantiate variables via tf.get_variable. The underlying variable scope thus keeps track of any variables, and returning cached versions. This is atypical of tf.layer objects, which separate this
part of layer building into a build method that is only called once.

Here we provide a subclass for RNNCell objects that act exactly as
Layer objects do. They must provide a build method and their
call methods do not access Variables tf.get_variable
所以我个人认为这句不需要加，求各位帮忙解答下，该不该加这句话

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-03-08 16:52
关注
构造CNN以及LSTM等模型的时候，需要重复使用共享权重
如果你不要重复使用共享权重，就不要这一句

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

RNN 展开实现LSTM按时间步迭代时，有必要令reuse=true么？ tensorflow 人工智能深度学习神经网络自然语言处理
2019-04-06 15:23

回答 1 已采纳看你的数据是怎样的，如果每组数据之间在时序上独立，就不要reuse，否可可以use。简单来说，不用reuse，也就是不共享权值不会有什么大影响，但是错误用了它，会导致正确率不上升。
keras下用RNN中的lstm来进行图片分类，输入维数的错误 python tensorflow 人工智能深度学习神经网络
2020-04-26 15:07

回答 1 已采纳 lstm做图片分类？一般来说CNN才用来做图片分类。 model.add(LSTM(units=nb_lstm_outputs, return_sequences=True,
吴恩达deeplearning.ai课程中序列模型这一章的作业Rnn（lstm）反向传播推导 lstm rnn 深度学习
2018-08-23 06:40

回答 4 已采纳 https://blog.csdn.net/Koala_Tree/article/details/79299358
基于LSTM的股票预测模型_python实现_超详细
2019-07-05 22:25

zxm_的博客文章目录一、背景二、主要技术介绍1、RNN模型2、LSTM模型3、控制门工作原理四、代码实现五、案例分析六、参数设置七、结论一、背景近年来，股票预测还处于一个很热门的阶段，因为股票市场的波动十分巨大，随时...
tensorflow RNN LSTM代码运行不正确？ tensorflow 人工智能深度学习神经网络
2019-10-04 20:43

回答 2 已采纳试着把X和Y定义placeholder时的维度，由batch_size换成None. 因为你这样是固定了传入的数据集大小，在测试集时的维度是10000个，而不是batch-size个
LSTM/RNN 中的time_step到底如何设置? python 神经网络自然语言处理
2020-05-31 21:21

回答 1 已采纳 time_step 和input_size的乘积已经和你的一条语句的编码长度相同。感觉应该是这样处理的，你可以参考一下：编码后每条数据： [[0,0,0,1,1],[1,0,1,0,0],[
哪位知道怎样将RNN模型替换为GRU或者LSTM python 神经网络自然语言处理
2022-12-09 10:02

回答 1 已采纳望采纳，要把 RNN 模型替换成 GRU 或 LSTM，那么需要把原来使用的 RNN 层换成 GRU 层或 LSTM 层。这个过程有以下几个注意点：替换层时，需要确保输入和输出的形状相同。例如，如果
tensorflow RNN实现文本分类（LSTM）
2019-07-10 17:52

这是一个死肥宅的博客但上述所说使用time_major = True避免了RNN计算开始和结束时的转置，这个转置如何理解？希望有知晓的大佬分享一下。 2.为什么通过上述代码LSTM进行文本分类反而得到了更差的结果？对此我的猜测为： 1.输入的...
无编程基础如何学习LSTM lstm rnn 神经网络
2022-01-27 14:51

回答 1 已采纳 1、因为未接触编程，所以有必要掌握至少一门编程语言。考虑到从事AI相关研究，建议学习Python，其次是C++；2、学习Pytorch框架，其有Python和C++接口，根据你学习的语言决定；3、学习
为什么RNN无法处理长序列？ rnn 人工智能机器学习
2022-11-10 21:32

回答 1 已采纳梯度爆炸或者梯度消失，你想想每个时刻都累加一点点，序列一长到后面是很可观的。这也是为什么会有LSTM出现的原因，就是为了解决长序列的问题
Pytorch框架nn.RNN训练时反向传播报错 c++ python pytorch
2023-03-22 16:17

回答 5 已采纳基于最新版ChatGPT4的回答，望采纳!!!有其他问题也可以询问我哦、”(最新版更智能，功能更加强大) 这个问题是由于在循环中，计算图被保留了，但在每次循环时，其实我们需要重新构建计算图。因此，需要
Kesci：Tensorflow 实现 LSTM——时间序列预测（超详细）
2019-10-13 08:24

萧居士的博客云脑项目3 -真实业界数据的时间序列预测挑战 https://www.kesci.com/home/project/5a391c670e1fc52691fde623这篇文章将讲解如何使用lstm进行时间序列方面的预测，重点讲lstm的应用，原理部分可参考以下两篇文章： ...
LSTM的格式与卷积。。。。。。。。。。。 tensorflow 人工智能深度学习神经网络
2019-06-19 11:22

回答 2 已采纳 inputs = Input(shape=(28, 140, 1)) s_model = Sequential() s_model.add(LSTM(140)) s_model.add
递归神经网络RNN网络 LSTM
2018-10-14 18:49

Voyege-Class的博客前言: 根据我本人学习 TensorFlow 实现 LSTM 的经历，发现网上虽然也有不少教程，其中很多都是根据官方给出的例子，用多层 LSTM 来实现 PTBModel 语言模型，比如： tensorflow笔记：多层LSTM代码分析但...
基于LSTM的股票预测
2023-07-20 21:06

月融花下的博客 RNN主要用来处理序列数据，在传统的神经网络模型中，是从输入层到隐含层再到输出层，每层内的节点之间无连接，循环神经网络中一个当前神经元的输出与前面的输出也有关，网络会对前面的信息进行记忆并应用于当前神经...
没有解决我的问题, 去提问

悬赏问题

¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败
¥15 计组这些题应该咋做呀
¥60 更换迈创SOL6M4AE卡的时候，驱动要重新装才能使用，怎么解决？
¥15 让node服务器有自动加载文件的功能
¥15 jmeter脚本回放有的是对的有的是错的
¥15 r语言蛋白组学相关问题
¥15 Python时间序列如何拟合疏系数模型

RNN 展开实现LSTM按时间步迭代时，有必要令reuse=true么

2条回答 默认 最新

悬赏问题

2条回答默认最新