Dexter524 2023-01-01 10:00 采纳率: 100%
浏览 153
已结题

LSTM里seq_len的具体意义

我在处理训练lstm时发现,全连接层只是处理了hiddensize,但是最后返回的时候会有seq_len那么多的预测值y,这种情况下是不是取最后一个求loss来backward呢?
我数据一天的特征值是50,打算用五天的数据推测第六天的单输出y,这种情况下,我的seq_len是5吗?
(batchsize=1)我将数据调整为(5,1,50)输入,取最后一个预测值和我的y进行比较是不是有问题?
还是说我这样的输入其实是用一天的特征值来求第二天的y?
也就是说seq_len个输入需要对应seq_len个输出?
求解答!感谢🙏

http://t/

  • 写回答

7条回答 默认 最新

  • |__WhoAmI__| 2023-01-01 11:02
    关注

    你说的这情况中,可能是希望使用五天的数据来预测第六天的输出。

    对于输入数据,序列长度(seq_len)通常表示使用多少时间步来进行预测。因此在情况中,seq_len应设为5。输入数据形状应为(batch_size,seq_len,input_size),即(5,1,50)。

    对于输出数据,如果LSTM网络的最后一层是全连接层,那么它将为每个时间步生成一个输出。因此最终会得到seq_len个预测值。在情况中,可能希望只使用最后一个时间步的预测值来计算损失并进行反向传播。

    但是这取决于目标任务和模型的设计。假如目标是预测每一天的输出,那么可能希望使用所有seq_len个时间步的预测值来计算损失,并使用所有seq_len个时间步的真实值来计算损失。

    所以简单的答案是,是否使用seq_len个预测值来计算损失取决于目标任务和模型的设计。如果希望使用所有seq_len个预测值来计算损失,就可以将真实值与预测值进行比较,然后使用所有seq_len个时间步的损失之和来进行反向传播。

    然而,在某些情况下,可能希望使用最后一个时间步的预测值来计算损失,因为可能只关心最终的预测结果。在这种情况下,可以将最后一个时间步的预测值与真实值进行比较,然后使用最后一个时间步的损失来进行反向传播。

    总的来说,如何使用seq_len个预测值来计算损失取决于目标任务和模型的设计。重要的是要确保模型的设计与目标任务相匹配,这样才能得到最佳的结果。
    仅供参考,望采纳,谢谢。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(6条)

报告相同问题?

问题事件

  • 系统已结题 1月13日
  • 已采纳回答 1月5日
  • 修改了问题 1月1日
  • 修改了问题 1月1日
  • 展开全部

悬赏问题

  • ¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
  • ¥15 随身WiFi网络灯亮但是没有网络,如何解决?
  • ¥15 gdf格式的脑电数据如何处理matlab
  • ¥20 重新写的代码替换了之后运行hbuliderx就这样了
  • ¥100 监控抖音用户作品更新可以微信公众号提醒
  • ¥15 UE5 如何可以不渲染HDRIBackdrop背景
  • ¥70 2048小游戏毕设项目
  • ¥20 mysql架构,按照姓名分表
  • ¥15 MATLAB实现区间[a,b]上的Gauss-Legendre积分
  • ¥15 delphi webbrowser组件网页下拉菜单自动选择问题