LSTM里seq_len的具体意义

我在处理训练lstm时发现，全连接层只是处理了hiddensize，但是最后返回的时候会有seq_len那么多的预测值y，这种情况下是不是取最后一个求loss来backward呢？
我数据一天的特征值是50，打算用五天的数据推测第六天的单输出y，这种情况下，我的seq_len是5吗？
（batchsize=1）我将数据调整为（5，1，50）输入，取最后一个预测值和我的y进行比较是不是有问题？
还是说我这样的输入其实是用一天的特征值来求第二天的y？
也就是说seq_len个输入需要对应seq_len个输出？
求解答！感谢🙏

http://t/

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

7条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
|__WhoAmI__| 2023-01-01 11:02
关注
你说的这情况中，可能是希望使用五天的数据来预测第六天的输出。

对于输入数据，序列长度（seq_len）通常表示使用多少时间步来进行预测。因此在情况中，seq_len应设为5。输入数据形状应为（batch_size，seq_len，input_size），即（5，1，50）。

对于输出数据，如果LSTM网络的最后一层是全连接层，那么它将为每个时间步生成一个输出。因此最终会得到seq_len个预测值。在情况中，可能希望只使用最后一个时间步的预测值来计算损失并进行反向传播。

但是这取决于目标任务和模型的设计。假如目标是预测每一天的输出，那么可能希望使用所有seq_len个时间步的预测值来计算损失，并使用所有seq_len个时间步的真实值来计算损失。

所以简单的答案是，是否使用seq_len个预测值来计算损失取决于目标任务和模型的设计。如果希望使用所有seq_len个预测值来计算损失，就可以将真实值与预测值进行比较，然后使用所有seq_len个时间步的损失之和来进行反向传播。

然而，在某些情况下，可能希望使用最后一个时间步的预测值来计算损失，因为可能只关心最终的预测结果。在这种情况下，可以将最后一个时间步的预测值与真实值进行比较，然后使用最后一个时间步的损失来进行反向传播。

总的来说，如何使用seq_len个预测值来计算损失取决于目标任务和模型的设计。重要的是要确保模型的设计与目标任务相匹配，这样才能得到最佳的结果。
仅供参考，望采纳，谢谢。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(6条)

报告相同问题？

关注问题

LSTM里seq_len的具体意义 lstm python pytorch
2023-01-01 10:00

回答 7 已采纳你说的这情况中，可能是希望使用五天的数据来预测第六天的输出。对于输入数据，序列长度（seq_len）通常表示使用多少时间步来进行预测。因此在情况中，seq_len应设为5。输入数据形状应为（batc
LSTM/RNN 中的time_step到底如何设置? python 神经网络自然语言处理
2020-05-31 21:21

回答 1 已采纳 time_step 和input_size的乘积已经和你的一条语句的编码长度相同。感觉应该是这样处理的，你可以参考一下：编码后每条数据： [[0,0,0,1,1],[1,0,1,0,0],[
找的lstm模型里没有学习率这个参数 python
2021-07-21 10:15

回答 2 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 请看👉 ：深度学习-利用LSTM预测多输出如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
Pytorch+LSTM+Attention 实现 Seq2Seq
2022-06-15 19:51

linxizi0622的博客采用pytorch框架实现的基于Seq2seq+Attention的机器翻译模型
利用Python写LSTM python 数据挖掘神经网络
2022-12-23 17:15

回答 1 已采纳用reshape(1080,36,1)试一下
python lstm建模报错：ValueError: too many values to unpack (expected 2) lstm python pytorch
2021-11-25 21:13

回答 1 已采纳 get_train_data() 定义的方法返回就一个值你用x，y两个变量去接收肯定会报错
Python编写LSTM神经网络 python 数据挖掘
2022-09-30 14:31

回答 2 已采纳版本警告而已，提示你你里面的有些库后续版本可能变更或者API改变，不用管，不是错误信息
基于LSTM的时间序列预测-原理-python代码详解
2018-09-05 22:18

小小何先生的博客基于LSTM的时间序列预测-原理-python代码详解
利用Python编写LSTM神经网络 python 数据挖掘
2022-10-05 08:15

回答 2 已采纳 ModelCheckpoint中的monitor参数值应该是'val_loss'
pytorch搭建的cnn-lstm的Tensor问题 cnn python pytorch
2022-10-19 08:47

回答 1 已采纳你看下这篇博客吧, 应该有用👉 ：pytorch+cnn+lstm+词向量
python短期电力预测——基于LSTM神经网络
2022-04-16 16:06

中意灬的博客 LSTM神经网络，一种中长期时间序列预测模型，通过长期得到数据来预测未来短期的结果，对中长期预测效果很差，本文只介绍单变量预测，即通过多天的电力数据来预测短期的电力，影响因素只有时间，不考虑其他影响因素...
Pytorch lstm中batch_first 参数理解使用
2022-10-16 20:32

噗呲噗呲咔咔的博客 2、原因是cuDNN中RNN的Api就是batch_size在第二个维度，这么设置的目的如下（以下举例非原创，摘抄自-知乎文章：读PyTorch源码学习RNN）举个例子，假设输入序列的长度(seq_len)是3，batch_size是2，一个batch的...
Pytorch+LSTM+Encoder+Decoder实现Seq2Seq模型
2022-06-14 11:22

linxizi0622的博客将Seq2Seq模型个构建采用Encoder类和Decoder类融合
[干货]深入浅出LSTM及其Python代码实现
2020-01-30 17:14

沙漏AI机器人的博客 [干货]深入浅出LSTM及其Python代码实现人工神经网络在近年来大放异彩，在图像识别、语音识别、自然语言处理与大数据分析领域取得了巨大的成功，而长短期记忆网络LSTM作为一种特殊的神...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月1日
展开全部

悬赏问题

¥15 (标签-UDP|关键词-client)
¥15 关于库卡officelite无法与虚拟机通讯的问题
¥15 qgcomp混合物线性模型分析的代码出现错误：Model aliasing occurred
¥100 已有python代码，要求做成可执行程序，程序设计内容不多
¥15 目标检测项目无法读取视频
¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
¥15 小红薯封设备能解决的来
¥100 求采集电商背景音乐的方法
¥15 数学建模竞赛求指导帮助
¥15 STM32控制MAX7219问题求解答

LSTM里seq_len的具体意义

7条回答 默认 最新

问题事件

悬赏问题

7条回答默认最新