Zhyan1212 2023-04-21 15:50 采纳率: 63.6%
浏览 14
已结题

关于gru输入输出提取问题

首先,我的数据shape为**[128,1,500],
具体为
[batch_size, channel , features_length];**

GRU要求的对于这个input tensor,
①如果输入的tensor有三个维度: (sequence_length, batch_size, input_size)

②如果在定义 GRU 的时候,设置了 batch_first = True
那么输入的tensor的三个维度:** (batch_size, sequence_length, input_size)**

也就是说,我的数据按照第②条作为输入:需要由**[128,1,500]变为**[128,500,1],
GRU设置为
nn.GRU(1, 128, 1, batch_first=True)**
这样是对的嘛?

其次,我想利用GRU进行特征提取,取隐藏层输出,表现为** output, hidden = GRU(x)**,

输出的hidden各个维度的含义: (D∗num_layers, batch_size,hidden_out),
为了导入下一层网络,我需要交换第0维度与第1维度变为**( batch_size,D∗num_layers,hidden_out)**

以上的理解是否正确?

  • 写回答

2条回答 默认 最新

  • 半调子全栈 2023-04-22 16:20
    关注

    关于第一个问题,将输入的tensor由 [128,1,500] 转换为 [128,500,1] 并使用 nn.GRU(1, 128, 1, batch_first=True) 是正确的。因为在 batch_first=True 的情况下,输入tensor的维度应该是 (batch_size, sequence_length, input_size),而在这个模型中,input_size=1,所以需要将原始的 [128,1,500] 调整为 [128,500,1]。

    关于第二个问题,GRU输出的hidden tensor的维度应该是 (num_layers * num_directions, batch_size, hidden_size),其中num_directions=1,因为这是一个单向GRU模型,因此hidden tensor的维度应该是 (num_layers, batch_size, hidden_size)。在这种情况下,为了导入下一层网络,需要将维度调整为 (batch_size, num_layers, hidden_size),因为PyTorch中RNN模块的输出维度默认不是(batch_size, num_layers, hidden_size)。你可以通过调用permute函数来实现这个变换,例如:

    hidden = hidden.permute(1, 0, 2)  # 将第0维和第1维交换
    
    
    

    这将把维度从 (num_layers, batch_size, hidden_size) 转换为 (batch_size, num_layers, hidden_size)。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 5月2日
  • 已采纳回答 4月24日
  • 创建了问题 4月21日

悬赏问题

  • ¥15 微信会员卡等级和折扣规则
  • ¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
  • ¥15 随身WiFi网络灯亮但是没有网络,如何解决?
  • ¥15 gdf格式的脑电数据如何处理matlab
  • ¥20 重新写的代码替换了之后运行hbuliderx就这样了
  • ¥100 监控抖音用户作品更新可以微信公众号提醒
  • ¥15 UE5 如何可以不渲染HDRIBackdrop背景
  • ¥70 2048小游戏毕设项目
  • ¥20 mysql架构,按照姓名分表
  • ¥15 MATLAB实现区间[a,b]上的Gauss-Legendre积分