librosa提取的mfcc的格式是什么样的？

f = librosa.load('w.wav')
get_mfcc = librosa.feature.mfcc(y=f[0], sr=8000, n_mfcc=12)

w.wav是一个0.5s的录音文件，采样率8000，双声道，16位深。也就是说有4000个采样点。按照默认的帧长2048，帧移512来计算，这里有int[(4000-2048)/512] + 1帧(4帧)。我以为结果输出的mfcc会是 12x4 的矩阵结果输出了 12x8的。有没有大佬知道列数到底和时间和帧长有什么关系？是不是录音格式的问题？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
jinsple 2021-07-05 16:27
关注
我觉得是双声道，所以是两段波形，一段是12x4，两段就是12x8

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

librosa 语音库（四）librosa.feature.mfcc
2022-03-10 16:41

ZhengXinTang的博客 LibROSA（本文使用的版本是0.6.3）中的mfcc函数可以用来提取音频的梅尔频率倒谱系数（Mel-Frequency Cepstral Coefficients，MFCCs）特征，MFCC被广泛应用于语音识别。 LibROSA的mfcc函数源码如下： # -- Mel ...
语音识别特征提取（Fbank和MFCC）
2023-07-02 21:29

又困又爱睡的博客 mfcc和fbank特征提取
RWK35xx特征提取MFCC提升语音性别识别率
2025-11-18 00:14

大苏牙的博客本文介绍如何利用RWK35xx协处理器硬件加速MFCC特征提取，实现低功耗、高精度的边缘端语音性别识别。主控MCU仅需处理分类任务，显著降低计算负担与能耗，适用于本地化智能设备。
语音识别--基于MFCC和多层感知机的语音情感识别
2024-05-07 19:37

不懂开发的程序猿的博客本实验学习使用库 librosa、soundfile 和 sklearn（以及其他） MLPClassifier 构建模型。通过本实验我们学习到了多层感知机实现语音分类的...- 使用MFCC提取声音特征 - 使用sklearn创建多层感知机 - 模型的性能评价方法
关于AI人工智能的知识图谱简介
2025-05-15 22:38

路溪非溪的博客可参考B站人工智能课程：【整整600集】清华大学196小时讲完的AI人工智能从入门到精通全套教程，全程干货无废话！学完变大佬！这还学不会，我退出IT圈！机器学习-深度学习-opencv_哔哩哔哩_bilibili 国内大模型大全 ...
AI人工智能语音识别与机器学习的关系
2025-05-08 18:58

AI智能探索者的博客本文旨在系统性地阐述人工智能语音识别技术与机器学习之间的内在联系和技术实现方式。我们将覆盖从基础理论到实际应用的完整知识体系，包括信号处理、特征提取、模型训练和性能优化等关键环节。文章首先介绍基本概念...
AI人工智能语音识别在社交电商中的应用潜力
2025-07-14 14:01

AI智能架构工坊的博客本文旨在探讨AI语音识别技术在社交电商平台中的应用价值和技术实现路径。研究范围包括语音识别核心技术、与电商场景的融合方式、实际应用案例以及未来发展方向。文章首先介绍语音识别技术基础，然后深入分析其在社交...
RWK35xx MFCC特征计算支撑语音意图识别
2025-11-17 01:28

西域情歌的博客本文深入解析瑞芯微RWK35xx系列芯片如何通过HiFi4 DSP和APU硬件加速实现高效的本地MFCC特征提取，支持低功耗、高响应的离线语音识别应用，适用于智能家居、车载系统等边缘场景。
AI原生应用推动语音识别技术升级
2025-07-21 15:52

程序员光剑的博客本文先介绍核心概念，包括语音识别技术和AI原生应用是什么，以及它们之间的联系。然后讲解推动升级的核心算法原理、数学模型和公式。通过项目实战展示实际代码应用，接着探讨应用场景、推荐工具资源。最后分析未来...
深入理解梅尔倒谱系数（MFCC）计算与应用
2025-08-02 16:02

AWS云计算的博客语音信号特征提取方法MFCC 语音信号处理是现代通信和人工智能领域中至关重要的技术之一。在这些应用中，为了准确分析和识别语音信号，需要从原始语音信号中提取出具有区分性的特征。梅尔频率倒谱系数（MFCC）是一种...
深度洞察：AI应用架构师为智能数字身份验证系统带来的创新
2025-09-11 23:47

AI量化价值投资入门到精通的博客目的：解释AI架构师如何用技术创新解决传统身份验证的痛点（如密码易忘、指纹易伪造、隐私泄露），让系统更"聪明"（能识别真实用户）、更"贴心"（不用反复输入信息）、更"安全"（不泄露隐私）。范围：覆盖智能身份...
MFCC_Feature_Extraction提取小智音箱语音特征
2025-11-01 20:37

CodeMystic的博客 MFCC特征提取模拟人耳听觉特性，通过预加重、分帧、梅尔滤波和DCT等步骤将语音转化为紧凑倒谱系数，广泛应用于语音识别系统。
Cleer Arc5耳机情绪识别声音特征提取方法
2025-11-20 01:21

胡说先森的博客本文深入解析Cleer Arc5开放式耳机如何通过声音特征提取实现情绪识别，涵盖MFCC、基频F0、能量与过零率等核心声学特征，以及端侧实时处理的工程优化方案，揭示其在低功耗、高隐私场景下的关键技术路径。
AI语音识别模型训练：从数据准备到部署全流程
2025-06-24 15:55

AI架构师小马的博客本文旨在为读者提供从零开始构建一个AI语音识别系统的完整指南。我们将覆盖从数据准备到模型部署的全流程，重点介绍现代深度学习技术在语音识别领域的应用。核心概念与联系：介绍语音识别的基本原理和关键技术数据...
提示工程架构师如何通过上下文工程优化语音识别性能？
2025-08-23 17:12

Agentic AI人工智能与大数据的博客在当今的智能交互系统中，语音识别（Automatic Speech Recognition, ASR）作为人机交互的入口，其性能直接决定了用户体验的质量。然而，在实际应用中，ASR系统常常面临诸多挑战：专业领域术语识别错误、噪声环境下...
智能家居安防系统的智能化升级：基于AI技术的创新技术
2023-07-01 03:55

程序员光剑的博客智能家居安防系统的核心技术在于AI技术的应用。通过引入人脸识别技术，可以对用户进行身份认证，确保家庭安全。运动检测技术可以监测用户的行为，为是否有人入侵提供依据。声音识别技术则可以检测用户声音中的异常，...
多模态AI模型应用：架构师必须知道的部署和运维策略
2025-08-12 20:50

AI 数据结构与算法学习的博客多模态AI（Multimodal AI）是指能够处理、理解、融合并生成两种或多种不同类型数据（模态）的人工智能系统。这里的“模态”指的是信息的呈现或感知方式。常见模态类型：自然语言，如新闻、邮件、社交媒体评论、代码...
语音识别在AI原生应用中的精准度提升方法
2025-06-21 14:38

SuperAGI架构师的AI实验室的博客我们将重点关注适用于AI原生应用的现代语音识别技术，而非传统的语音处理算法。文章将从语音识别的基本原理开始，逐步深入到提升精准度的具体方法，包括数据、模型和系统层面的优化策略。最后通过实际案例展示这些...
为什么顶级提示系统都在用声学处理？这篇文章给你答案（附案例）
2025-09-01 01:43

操作系统内核探秘的博客对着智能音箱说“我饿了”，它却推荐了“附近的书店”；用ChatGPT Voice聊心事，它的回应像“读课文”一样冰冷；在嘈杂的地铁里喊“打开导航”，手机却完全没反应——这些“交互翻车”的背后，不是AI不够聪明，而是...
AIGC音乐生成中的迁移学习实践
2025-04-28 21:45

程序员光剑的博客随着AIGC（人工智能生成内容）技术的快速发展，音乐生成领域正经历从规则驱动到数据驱动的范式转变。传统基于隐马尔可夫模型（HMM）或概率图模型的方法，在处理复杂音乐结构时面临数据稀疏性难题，而深度学习模型虽...
没有解决我的问题, 去提问

librosa提取的mfcc的格式是什么样的？

1条回答 默认 最新

1条回答默认最新