首先,我的数据shape为**[128,1,500],
具体为 [batch_size, channel , features_length];**
GRU要求的对于这个input tensor,
①如果输入的tensor有三个维度: (sequence_length, batch_size, input_size)
②如果在定义 GRU 的时候,设置了 batch_first = True
那么输入的tensor的三个维度:** (batch_size, sequence_length, input_size)**
也就是说,我的数据按照第②条作为输入:需要由**[128,1,500]变为**[128,500,1],
GRU设置为nn.GRU(1, 128, 1, batch_first=True)**
这样是对的嘛?
其次,我想利用GRU进行特征提取,取隐藏层输出,表现为** output, hidden = GRU(x)**,
输出的hidden各个维度的含义: (D∗num_layers, batch_size,hidden_out),
为了导入下一层网络,我需要交换第0维度与第1维度变为**( batch_size,D∗num_layers,hidden_out)**
以上的理解是否正确?