LSTM/RNN 中的time_step到底如何设置?

新手尝试用LSTM进行字段分类, 数据集如下

Data ----- Label

DKWL----0
FCHN----0
KDQP----0
IHGS----1
....

然后我进行了编码:

00011101000001000111-----1
.....
shape:(N,20)

接下来我建造了网络:

class RNN(nn.Module):
    def __init__(self):
        super(RNN, self).__init__()

        self.rnn = nn.LSTM(     
            input_size=20,     # 每个sample有20个feature
            hidden_size=64,     
            num_layers=1,       
            batch_first=True,   
        )

        self.out = nn.Linear(64, 2) # 2分类问题,所以output设置成了2

    def forward(self, x):
        r_out, (h_n, h_c) = self.rnn(x, None)   
        out = self.out(r_out[:, -1, :])
        return out

最后开始训练:

for epoch in range(EPOCH):
    for step, (x, b_y) in enumerate(train_loader):   # gives batch data
        b_x = x.view(-1, ?, ?)  
#这里的reshape我应该设置为多少? 按照教程,应该设置为(batch, time_step, input_size)的形式,因为我想让网络记住每个sample的feature的sequence,所以我把time_step设置成了20(一个sample有20个featur,最后我得到了(-1,20,20),但是会报错,然后我又改成了(-1,1,20), 这就没问题了,但是改成这样,是不是就没有记住feature的sequence?

        output = rnn(b_x)               
        loss = loss_func(output, b_y)   
        optimizer.zero_grad()          
        loss.backward()                 
        optimizer.step()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
吃鸡王者 2020-06-01 15:13
关注
time_step 和input_size的乘积已经和你的一条语句的编码长度相同。
感觉应该是这样处理的，你可以参考一下：
编码后每条数据：
[[0,0,0,1,1],[1,0,1,0,0],[0,0,0,1,0],[0,0,1,1,1] -----1

输入数据的shape应该为：（N，4，5）

time_step=4
input_size=5

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

LSTM/RNN 中的time_step到底如何设置? python 神经网络自然语言处理
2020-05-31 21:21

回答 1 已采纳 time_step 和input_size的乘积已经和你的一条语句的编码长度相同。感觉应该是这样处理的，你可以参考一下：编码后每条数据： [[0,0,0,1,1],[1,0,1,0,0],[
keras下用RNN中的lstm来进行图片分类，输入维数的错误 python tensorflow 人工智能深度学习神经网络
2020-04-26 15:07

回答 1 已采纳 lstm做图片分类？一般来说CNN才用来做图片分类。 model.add(LSTM(units=nb_lstm_outputs, return_sequences=True,
tensorflow RNN LSTM代码运行不正确？ tensorflow 人工智能深度学习神经网络
2019-10-04 20:43

回答 2 已采纳试着把X和Y定义placeholder时的维度，由batch_size换成None. 因为你这样是固定了传入的数据集大小，在测试集时的维度是10000个，而不是batch-size个
通过代码学习RNN，彻底弄懂time_step
2019-09-16 09:20

凌逆战的博客文章转载自凌逆战的博客园—通过代码学习RNN，彻底弄懂time_step - 凌逆战 - 博客园这篇博客不是一篇讲解原理的博客，这篇博客主要讲解tnesorlfow的RNN代码结构，通过代码来学习RNN，以及讲解time_steps，如果这篇...
吴恩达deeplearning.ai课程中序列模型这一章的作业Rnn（lstm）反向传播推导 lstm rnn 深度学习
2018-08-23 06:40

回答 4 已采纳 https://blog.csdn.net/Koala_Tree/article/details/79299358
使用Keras编写的LSTM，训练时出现loss: nan - val_loss: nan，该如何调整？ keras lstm 有问必答深度学习
2022-05-03 18:40

回答 2 已采纳原数据第一列是时间形式的20220503这种，在读数据之后进行下面操作，你的数据是简单的1 2 34这种，数据可能在处理过程丢失或者变成nan了，你可以一步步看看每次处理后当前的数据现在是什么格式 d
请问命名实体识别任务中如何在bilstm前加入embedding？ lstm nlp 自然语言处理
2022-01-17 21:39

回答 1 已采纳可以把BERT的Embedding层拿来用，也可以把BEET的输出视为embedding，也可以自己使用NN..Embedding定义一层Embedding层，自己进行训练
tensorflow 波士顿房价预测LSTM/RNN tensorboard 完整代码
2018-07-10 15:42

liangjiubujiu的博客在tensorflow里RNN才是做回归计算的正规军，其中LSTM更是让人工智能有了记忆，如果cnn最适合做的是图像识别，那么LSTM就是视频识别。网上的教程多是用正余弦数据在做预测，输入输出都是一维，我这用波士顿房价，输入...
LSTM里seq_len的具体意义 lstm python pytorch
2023-01-01 10:00

回答 7 已采纳你说的这情况中，可能是希望使用五天的数据来预测第六天的输出。对于输入数据，序列长度（seq_len）通常表示使用多少时间步来进行预测。因此在情况中，seq_len应设为5。输入数据形状应为（batc
关于#LSTM#的问题，如何解决？ lstm 机器学习
2023-03-17 11:20

回答 5 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：根据您提供的代码，可以发现训练出来的 LSTM 模型在预测时的表现并不理想。在分析时需要注意以下几点：数据归一化由于 LSTM 模型的特点，输入
RNN 展开实现LSTM按时间步迭代时，有必要令reuse=true么？ tensorflow 人工智能深度学习神经网络自然语言处理
2019-04-06 15:23

回答 1 已采纳看你的数据是怎样的，如果每组数据之间在时序上独立，就不要reuse，否可可以use。简单来说，不用reuse，也就是不共享权值不会有什么大影响，但是错误用了它，会导致正确率不上升。
Keras 中 LSTM 的return_sequences和return_states之间的区别
2022-02-23 14:47

日拱一两卒的博客 keras中return_sequences和return_state参数的使用
LSTM模型如何进行新数据的预测？ python 人工智能机器学习深度学习神经网络
2019-07-04 15:21

回答 2 已采纳创建一个预测数组，每预测一个Y就往数组里放一个，同时更新你用来预测的自变量X数组，剔除最早的X，把预测值加入到X里，依次往后预测
LSTM_预测价格问题_keras_代码实操
2023-12-02 18:56

郭小儒的博客 transform(close_train) timestep=60 x_train=[] y_train=[] for i in range(timestep,close_scaled.shape[0]): x_train.append(close_scaled[i-timestep:i,0]) y_train.append(close_scaled[i,0]) x_train,y_train=...
rnn lstm gru_总体上简化GRU，LSTM和RNN
2020-08-10 19:51

weixin_26752765的博客 rnn lstm gruSequence models are a special class of deep neural networks that have applications in machine translation, speech recognition, image captioning, music generation, etc. Sequence problems ca...
没有解决我的问题, 去提问

悬赏问题

¥15 HFSS 中的 H 场图与 MATLAB 中绘制的 B1 场部分对应不上
¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？

LSTM/RNN 中的time_step到底如何设置?

1条回答 默认 最新

悬赏问题

1条回答默认最新