import torch
import numpy as np
wav_data1 = torch.tensor(np.arange(0,102.4,0.01))
请问如何把这个wav_data1,利用256的窗口,重叠区为128,变成32*128
import torch
import numpy as np
wav_data1 = torch.tensor(np.arange(0,102.4,0.01))
请问如何把这个wav_data1,利用256的窗口,重叠区为128,变成32*128
PyTorch内置的STFT函数为torch.stft,它可以将时域信号转换为频域信号。输出的是一个复数张量,表示频域信号的幅度和相位信息。具体来说,输出的形状为(N, C, L // hop_length + 1, fft_size // 2 + 1, 2),其中N是batch size,C是通道数,L是输入信号的长度,hop_length是帧移参数,fft_size是FFT窗口大小。最后一个维度的2表示幅度和相位信息。