LSTM里seq_len的具体意义

我在处理训练lstm时发现，全连接层只是处理了hiddensize，但是最后返回的时候会有seq_len那么多的预测值y，这种情况下是不是取最后一个求loss来backward呢？
我数据一天的特征值是50，打算用五天的数据推测第六天的单输出y，这种情况下，我的seq_len是5吗？
（batchsize=1）我将数据调整为（5，1，50）输入，取最后一个预测值和我的y进行比较是不是有问题？
还是说我这样的输入其实是用一天的特征值来求第二天的y？
也就是说seq_len个输入需要对应seq_len个输出？
求解答！感谢🙏

http://t/

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

7条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
|__WhoAmI__| 2023-01-01 11:02
关注
你说的这情况中，可能是希望使用五天的数据来预测第六天的输出。

对于输入数据，序列长度（seq_len）通常表示使用多少时间步来进行预测。因此在情况中，seq_len应设为5。输入数据形状应为（batch_size，seq_len，input_size），即（5，1，50）。

对于输出数据，如果LSTM网络的最后一层是全连接层，那么它将为每个时间步生成一个输出。因此最终会得到seq_len个预测值。在情况中，可能希望只使用最后一个时间步的预测值来计算损失并进行反向传播。

但是这取决于目标任务和模型的设计。假如目标是预测每一天的输出，那么可能希望使用所有seq_len个时间步的预测值来计算损失，并使用所有seq_len个时间步的真实值来计算损失。

所以简单的答案是，是否使用seq_len个预测值来计算损失取决于目标任务和模型的设计。如果希望使用所有seq_len个预测值来计算损失，就可以将真实值与预测值进行比较，然后使用所有seq_len个时间步的损失之和来进行反向传播。

然而，在某些情况下，可能希望使用最后一个时间步的预测值来计算损失，因为可能只关心最终的预测结果。在这种情况下，可以将最后一个时间步的预测值与真实值进行比较，然后使用最后一个时间步的损失来进行反向传播。

总的来说，如何使用seq_len个预测值来计算损失取决于目标任务和模型的设计。重要的是要确保模型的设计与目标任务相匹配，这样才能得到最佳的结果。
仅供参考，望采纳，谢谢。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(6条)

报告相同问题？

关注问题

Pytorch lstm中batch_first 参数理解使用
2022-10-16 20:32

噗呲噗呲咔咔的博客 2、原因是cuDNN中RNN的Api就是batch_size在第二个维度，这么设置的目的如下（以下举例非原创，摘抄自-知乎文章：读PyTorch源码学习RNN）举个例子，假设输入序列的长度(seq_len)是3，batch_size是2，一个batch的...
Pytorch中RNN LSTM的input（重点理解batch_size/time_steps）
2020-06-27 10:46

ch206265的博客原文链接：Pytorch中如何理解RNN LSTM的input（重点理解seq_len/time_steps） - 阿矛布朗斯洛特的文章 - 知乎在建立时序模型时，若使用keras，我们在Input的时候就会在shape内设置好sequence_length（后面均用seq_...
LSTM中的序列长度
2024-07-03 10:49

狂笑韦恩的博客具体来说，LSTM层期望的输入张量形状应该是(seq_len, batch, input_size)，但如果你设置了batch_first=True（这是PyTorch LSTM层的一个常用设置），则期望的输入张量形状变为(batch, seq_len, input_size)。...
Pytorch+LSTM+Attention 实现 Seq2Seq
2022-06-15 19:51

linxizi0622的博客采用pytorch框架实现的基于Seq2seq+Attention的机器翻译模型
python短期电力预测——基于LSTM神经网络
2022-04-16 16:06

中意灬的博客 LSTM神经网络，一种中长期时间序列预测模型，通过长期得到数据来预测未来短期的结果，对中长期预测效果很差，本文只介绍单变量预测，即通过多天的电力数据来预测短期的电力，影响因素只有时间，不考虑其他影响因素...
lstm 输入数据的形状是怎么样的，他有两种输入方式，通过参数 batch_first来设置默认是False
2024-12-10 23:43

zhangfeng1133的博客 lstm 输入数据的形状是怎么样的，他有两种输入方式，通过参数 batch_first来设置默认是False。
alibaba_seq_behavior
2021-03-11 11:51

for i in range(len(seq)-1): G.add_edge(seq[i], seq[i+1]) ``` 然后，你可以计算转移概率并基于此进行预测： ```python transition_probs = nx.algorithms.shortest_paths.weighted.shortest_path_length(G, ...
Pytorch+LSTM+Encoder+Decoder实现Seq2Seq模型
2022-06-14 11:22

linxizi0622的博客将Seq2Seq模型个构建采用Encoder类和Decoder类融合
使用 Python 的 LSTM 进行股市预测
2024-04-08 09:26

无水先生的博客 LSTM 模型非常强大，尤其是在设计上保留长期记忆，正如您稍后将看到的。您将在本教程中解决以下主题：了解为什么您需要能够预测股价走势；下载数据 - 您将使用从雅虎财经收集的股票市场数据；分割训练测试数据并...
时间序列预测模型实战案例(三)(LSTM)(Python)(深度学习)时间序列预测(包括运行代码以及代码讲解)
2023-09-20 10:31

Snu77的博客 LSTM（Long Short-Term Memory）是一种常用的循环神经网络（RNN）模型，用于处理序列数据，具有记忆长短期的能力。在时间序列预测中，LSTM既可以多元预测机制又可以作为单元预测机制使用。LSTM的预测效果图其中MAE...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月1日
展开全部

LSTM里seq_len的具体意义

7条回答 默认 最新

问题事件

7条回答默认最新