用python试MFCC，不同的方法结果不同，请哪位大侠帮忙看看

刚开始学习MFCC，从网上找了两种方法，求MFCC，试用了下，发现结果完全不同，请高手帮忙解释，或能给出正确结果：
代码如下：
import numpy as np
from scipy import signal
from scipy.fftpack import dct
import pylab as plt
import librosa

def enframe(wave_data, nw, inc, winfunc):
'''将音频信号分帧。
参数含义：
wave_data:原始音频型号
nw:每一帧的长度(这里指采样点的长度，即采样频率乘以时间间隔)
inc:相邻帧的间隔
'''
wlen=len(wave_data) #信号总长度
if wlen<=nw:
nf=1
else:
nf=int(np.ceil((1.0*wlen-nw+inc)/inc))
pad_length=int((nf-1)*inc+nw) #所有帧加起来总的铺平后的长度
print(wlen,nf, pad_length)
zeros=np.zeros((pad_length-wlen,)) #不够的长度使用0填补
pad_signal=np.concatenate((wave_data,zeros)) #填补后的信号
indices=np.tile(np.arange(0,nw),(nf,1))+np.tile(np.arange(0,nf*inc,inc),(nw,1)).T #相当于对所有帧的时间点进行抽取，得到nf*nw长度的矩阵
indices=np.array(indices,dtype=np.int32 #indices 为pad_signal的位置
frames=pad_signal[indices] #得到帧信号
win=np.tile(winfunc,(nf,1)) #window窗函数，这里默认取1
return frames*win #返回帧信号矩阵

Df=5 #采样点时间间隔
fs=8000 #采样频率
N=fs/Df #采样点数

t = np.arange(0,(N-1)/fs,1/fs) #取样时间

wave_data=np.sin(2*np.pi*200*t) # 待处理的信号

#预加重
b,a = signal.butter(1,1-0.97,'high')
emphasized_signal = signal.filtfilt(b,a,wave_data)

#归一化
lifts=[]
for n in range(1,13):
lift =1 + 6 * np.sin(np.pi * n / 12)
lifts.append(lift)

#分帧、加窗
winfunc = signal.hamming(256) #汉明窗

#分帧函数：每帧长度256 ，不重叠长度80：
X=enframe(wave_data, 256, 80, winfunc)
frameNum =X.shape[0] #获取分帧后的帧数

下面是三组代码及结果
（1）第一种情况：
for i in range(frameNum):
y=X[i,:]
yf = np.abs(np.fft.rfft(y))
melM = librosa.feature.mfcc(y,fs,S=yf,n_mfcc=12)
print(melM)
输出结果：
[12.01187176 16.44704344 15.61216672 14.38118246 12.77777051 10.84203157 8.62860918 6.19697322 3.61622903 0.95595607 -1.70837193 -4.30547829]

（2）第二种情况：
for i in range(frameNum):
y=X[i,:]
yf = np.abs(np.fft.rfft(y))
yf=yf**2
melM = librosa.feature.mfcc(y,fs,S=yf,n_mfcc=12)
print(melM)
输出结果：
[ 570.37065963 795.19627788 761.25293536 705.78283689 630.39580985 537.27662246 429.12048164 309.05311082 180.53860667 47.27705996 -86.90415637 -218.16302183]
这两种情况，MFCC对应的图的形状是相同

（3）第三种情况：
for i in range(frameNum):
y=X[i,:]
melM = librosa.feature.mfcc(y,fs,S=None,n_mfcc=12)
print(melM)
结果：
[[-278.17089678] [ 144.78769227] [ 56.44110736] [ 40.11968822]
[ 25.1757355 ] [ 14.67492614] [ 5.77245624] [ -0.96605092]
[ -7.23574856] [ -12.32471135] [ -17.40294169] [ -20.9566881 ]]

（4）第四种情况：
for i in range(frameNum):
y=X[i,:]
yf = np.abs(np.fft.rfft(y)) #频谱取模
yf = yf**2 #谱线能量

nfilt = 24   #Mel滤波器数量
low_freq_mel = 0
NFFT=256
high_freq_mel = (2595 * np.log10(1 + (fs / 2) / 700))  # 把 Hz 变成 Mel
mel_points = np.linspace(low_freq_mel, high_freq_mel, nfilt + 2)  # 将梅尔刻度等间隔
hz_points = (700 * (10**(mel_points / 2595) - 1))  # 把 Mel 变成 Hz
bin = np.floor((NFFT + 1) * hz_points / fs)
fbank = np.zeros((nfilt, int(np.floor(NFFT / 2 + 1))))  
for m in range(1, nfilt + 1):
    f_m_minus = int(bin[m - 1])   # left
    f_m = int(bin[m])             # center
    f_m_plus = int(bin[m + 1])    # right
    for k in range(f_m_minus, f_m):
        fbank[m - 1, k] = (k - bin[m - 1]) / (bin[m] - bin[m - 1])
    for k in range(f_m, f_m_plus):
        fbank[m - 1, k] = (bin[m + 1] - k) / (bin[m + 1] - bin[m])
filter_banks = np.dot(yf[0:129], fbank.T)
filter_banks = np.where(filter_banks == 0, np.finfo(float).eps, filter_banks)  # 数值稳定性
filter_banks = 10 * np.log10(filter_banks)  # dB   此为分贝标准公式 
filter_banks -= (np.mean(filter_banks, axis=0) + 1e-8)
#DCT系数
num_ceps = 12
c2 = dct(filter_banks, type=2, axis=-1, norm='ortho')[ 1 : (num_ceps + 1)] # Keep 2-13
c2 *= lifts

print(c2)
结果是：
[ 152.16939829 103.18780826 53.15848861 -3.0957145 -67.3315891
-123.00839875 -157.48879067 -150.09115643 -104.25335171 -47.27345817 -6.68998885 1.39787529]

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

python: mfcc 有没有人帮我解读一下这一句是什么意思 python
2022-03-29 21:14

回答 1 已采纳 dct变化后返回列表的所有行、第1列到第num_ceps列（切片）
矩阵的维数问题（想统一不同市场音频mfcc的维数）。 python 开发语言
2021-01-07 15:17

回答 4 已采纳你的矩阵是numpy 格式吧。用这个函数试试？这个是我的例子 d1=np.array([[1,2,3,4,5,1],[1,2,3,4,5,2],[1,2,3,4,5,3],[1,2,3,4,5,4
fisher特征选择原理 python 自然语言处理
2022-12-09 16:18

回答 1 已采纳望采纳可以使用Python的librosa库来计算MFCC特征，并使用sklearn库中的Fisher分类器来计算每个维度的贡献度。下面代码示例： import librosa import num
对Python使用mfcc的两种方式详解
2020-09-19 18:10

今天小编就为大家分享一篇对Python使用mfcc的两种方式详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
matlab如何将mfcc提取的特征变成模型 matlab 机器学习语音识别
2023-04-07 12:05

回答 2 已采纳把所有人的mfcc特征合成一个特征矩阵，然后80%训练20%测试，用SVM分类：比如： % 假设你有五个人的mfcc特征矩阵，分别为A、B、C、D和E。 % 每个特征矩阵包含n个样本，每个样本由m个m
TypeError: '_AtIndexer' object is not callable python tensorflow 深度学习神经网络自然语言处理
2020-12-17 19:28

回答 6 已采纳对的，给个采纳吧
MATLAB 未定义变量 "tdata" 或类 "tdata" c语言 matlab
2021-12-26 22:26

回答 1 已采纳你好，把正常运行的那些数据，你也需要一个个生成好，比如tdata这种，当然还有其他的变量，都保存成y.mat即可
利用python提取wav文件的mfcc方法
2021-01-21 17:26

如下所示： import scipy.io.wavfile as wav from python_speech_features import mfcc fs, audio = wav.read(abc.wav) feature_mfcc = mfcc(audio, samplerate=fs) ...以上这篇利用python提取wav文件的mfcc方法就是小
python提取MFCC
2018-04-02 10:16

包括提取MFCC的完整步骤，测试过可直接用，分享给大家
mfcc.zip_MFCC_mfcc in python_mfcc python_python mfcc_scale
2022-09-24 08:55

mfcc used in python mel-scale
yuhuimin_opensmilePython_opensmile_python_MFCC_
2021-09-30 13:48

利用python结合opensmile批量提取mfcc特征
MFCC.rar_MFCC_P6W_feature_python mfcc_python mfcc图
2022-07-14 18:28

本程序使用python编写的用于提取mfcc特征
Python实现音频转换为MFCC谱图示例代码使用librosa
2023-08-06 22:28

# Python实现音频转换为MFCC谱图示例代码使用librosa 本程序使用librosa库实现了计算音频文件的 MFCC（Mel Frequency Cepstral Coefficients）谱图。MFCC 是一种用于音频特征提取的方法，常用于语音识别、音频处理...
python语音信号提取MFCC特征参数
2021-04-26 23:49

输出MFCC特征参数为二维数组，行数表示帧数，12列表示12个MFCC特征参数
Python_MFCC-DTW.rar_MFCC_dtw_dtw模板训练_mfcc python_语音 python
2022-09-20 10:49

一个MFCC参数提取模板，和语音识别算法DTW。此模板采用25个滤波器
基于MATLAB和Python实现MFCC特征参数提取
2020-09-18 20:26

主要介绍了基于MATLAB和Python实现MFCC特征参数提取，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
audio_java.zip_python audio_python mfcc_tensorflow java_tensorfl
2022-09-24 22:26

python提取的乐器MFCC特征，调用TensorFlow 接口预测音频类别
基于MATLAB和Python实现MFCC特征参数提取.doc
2023-09-18 16:10

基于MATLAB和Python实现MFCC特征参数提取
GFCC和MFCC特征提取附python代码+仿真结果和运行方法.zip
2023-05-31 20:47

1.版本：matlab2014/2019a/2021a，内含运行结果，不会运行可私信 2.领域：智能优化算法、神经网络预测、信号处理、元胞自动机、图像处理、路径规划、无人机等多种领域的Matlab仿真，更多内容可点击博主头像 3.内容...
使用python实现语音文件的特征提取方法
2020-12-24 14:11

概述语音识别是当前人工智能的比较热门的方向，技术也比较成熟，各大公司也相继推出了各自的语音助手机器人，如百度的小度机器人、阿里的天猫精灵等。语音识别算法当前主要是由RNN、LSTM、DNN-HMM等机器学习和深度...
没有解决我的问题, 去提问

悬赏问题

¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器

码龄粉丝数原力等级 --

用python试MFCC，不同的方法结果不同，请哪位大侠帮忙看看

0条回答默认最新

悬赏问题

用python试MFCC， 不同的方法结果不同，请哪位大侠帮忙看看

0条回答 默认 最新

悬赏问题

用python试MFCC，不同的方法结果不同，请哪位大侠帮忙看看

0条回答默认最新