Dexter524 2023-01-01 10:00 采纳率: 100%
浏览 153
已结题

LSTM里seq_len的具体意义

我在处理训练lstm时发现,全连接层只是处理了hiddensize,但是最后返回的时候会有seq_len那么多的预测值y,这种情况下是不是取最后一个求loss来backward呢?
我数据一天的特征值是50,打算用五天的数据推测第六天的单输出y,这种情况下,我的seq_len是5吗?
(batchsize=1)我将数据调整为(5,1,50)输入,取最后一个预测值和我的y进行比较是不是有问题?
还是说我这样的输入其实是用一天的特征值来求第二天的y?
也就是说seq_len个输入需要对应seq_len个输出?
求解答!感谢🙏

http://t/

  • 写回答

7条回答 默认 最新

  • |__WhoAmI__| 2023-01-01 11:02
    关注

    你说的这情况中,可能是希望使用五天的数据来预测第六天的输出。

    对于输入数据,序列长度(seq_len)通常表示使用多少时间步来进行预测。因此在情况中,seq_len应设为5。输入数据形状应为(batch_size,seq_len,input_size),即(5,1,50)。

    对于输出数据,如果LSTM网络的最后一层是全连接层,那么它将为每个时间步生成一个输出。因此最终会得到seq_len个预测值。在情况中,可能希望只使用最后一个时间步的预测值来计算损失并进行反向传播。

    但是这取决于目标任务和模型的设计。假如目标是预测每一天的输出,那么可能希望使用所有seq_len个时间步的预测值来计算损失,并使用所有seq_len个时间步的真实值来计算损失。

    所以简单的答案是,是否使用seq_len个预测值来计算损失取决于目标任务和模型的设计。如果希望使用所有seq_len个预测值来计算损失,就可以将真实值与预测值进行比较,然后使用所有seq_len个时间步的损失之和来进行反向传播。

    然而,在某些情况下,可能希望使用最后一个时间步的预测值来计算损失,因为可能只关心最终的预测结果。在这种情况下,可以将最后一个时间步的预测值与真实值进行比较,然后使用最后一个时间步的损失来进行反向传播。

    总的来说,如何使用seq_len个预测值来计算损失取决于目标任务和模型的设计。重要的是要确保模型的设计与目标任务相匹配,这样才能得到最佳的结果。
    仅供参考,望采纳,谢谢。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(6条)

报告相同问题?

问题事件

  • 系统已结题 1月13日
  • 已采纳回答 1月5日
  • 修改了问题 1月1日
  • 修改了问题 1月1日
  • 展开全部

悬赏问题

  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 qgcomp混合物线性模型分析的代码出现错误:Model aliasing occurred
  • ¥100 已有python代码,要求做成可执行程序,程序设计内容不多
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
  • ¥15 小红薯封设备能解决的来
  • ¥100 求采集电商背景音乐的方法
  • ¥15 数学建模竞赛求指导帮助
  • ¥15 STM32控制MAX7219问题求解答