从wav格式音频中提取出某单一频率的信号

目的：
从wav格式音频中提取出某单一频率的信号，并以时域图形式呈现。

目前的实现思路：
通过FFT变换得到频域表达，包括各频率分量freqs与对应的振幅值fft_data，假设需要提取的单一频率为500hz，在频率分量中找到500hz所对应的索引（经FFT变换后得到的频率分量非整数，故无500hz存在，选择最接近500hz的频率分量，即500.00011hz），如下图所示：

因此，索引为6035，提取出fft_data[6035]和fft_data[-6035]即为单一频率500hz的振幅值，之后通过IFFT变换，从频域表达转换为时域表达，得到单一频率的时域图，如下图所示，为一个正弦波，其中左图为完整时间的时域图，右图为选取10ms的时域图：

为了验证上述方法的可靠性，使用带通滤波器方法和上述方法，提取400至500hz频率范围信号并以时域图形式呈现，结果如下图所示：
原始音频全频段

方法一：带通滤波器，允许400~500hz频率声音通过

方法二：提取400~500hz频率索引对应的振幅值，通过逆fft变换得到

由上可知，对于提取某频率范围信号，使用方法一和方法二得到同样的结果，认为方法二可靠，对于提取单一频率信号，带通滤波器不适用，使用方法二得到的单频信号为标准正弦波，但由于现场声音复杂，应该是同一频率多个相位的正弦波叠加，而非标准正弦波，存在矛盾。
或者有无其他提取单一频率信号的方法可供参考学习，请求指导！

# 读取WAV文件
sample_rate, audio_data = wavfile.read('E:\\Pycharmprojects\\2025\\shuiting\\BS\\MDJL\\data\\BS_MDJL_20250115_233221.wav')

# 计算FFT
fft_data = np.fft.fft(audio_data)

# 计算频率轴
freqs = np.fft.fftfreq(len(audio_data), 1/sample_rate)

# 找到500Hz的频率索引
target_freq = 500
target_idx = np.argmin(np.abs(freqs - target_freq))

# 提取大于等于500小于501hz的分量
fft_data_filtered = np.zeros_like(fft_data)

fft_data_filtered[target_idx] = fft_data[target_idx]
fft_data_filtered[-target_idx] = fft_data[-target_idx]  # 考虑到对称性

# 通过逆FFT转换回时域
filtered_signal = np.fft.ifft(fft_data_filtered)

# 绘制时域图
plt.figure(figsize=(8, 6))
time1 = np.linspace(0, len(audio_data) / sample_rate, len(audio_data))
filtered_audio_data = filtered_signal.real

# 绘制完整时间轴的时域图
plt.plot(time1, filtered_audio_data, label=str(target_freq) + 'Hz Signal')
plt.title('时域图')
plt.xlabel('时间(s)')
plt.ylabel('振幅')
# plt.ylim(-500, 500)  # 设置y轴范围
plt.legend(loc='upper right')
plt.grid(True)
plt.tight_layout()
plt.show()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-02-18 16:42
关注
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

解决方案

你可以使用 Python 语言和 SciPy 库来实现从 WAV 文件中提取单一频率的信号。下面是一个示例代码：

import numpy as np from scipy.io import wavfile from scipy.fftpack import fft # 读取 WAV 文件 sample_rate, data = wavfile.read('input.wav') # 计算 FFT fft_data = fft(data) # 获取频率数组 freqs = np.fft.fftfreq(len(data), 1/sample_rate) # 提取 500 Hz 的频率分量 index = np.where((freqs >= 490) & (freqs <= 510))[0][0] amp = fft_data[index] # 生成时域图 time_domain = np.real(np.fft.ifft(fft_data * np.exp(-2j * np.pi * 500 * np.arange(len(data)) / sample_rate))) # 可视化时域图 import matplotlib.pyplot as plt plt.plot(time_domain) plt.xlabel('Time (s)') plt.ylabel('Amplitude') plt.show()

这个代码首先读取 WAV 文件，然后计算 FFT，获取频率数组。接着，使用 np.where 函数找到 500 Hz 的频率分量的索引，然后提取该频率分量的振幅值。最后，使用 np.real 和 np.fft.ifft 函数将频域信号转换回时域信号，并可视化时域图。

请注意，这个代码假设了输入 WAV 文件的采样率为 44.1 kHz，如果你的采样率不同，需要相应地调整代码。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Simple Speech Recognition Untethered (SSRU)：无需在主脚本中加载多个 .wav 文件-matlab开发
2021-05-29 20:56

"Simple Speech Recognition Untethered (SSRU)" 是一个项目，它扩展了Simple Speech Recognition（SSR）的功能，特别是在处理多个.wav音频文件时不再需要在主脚本中加载它们。这意味着SSRU提供了更高效、更灵活的...
基于MATLAB的语音去噪处理系统
2022-02-12 12:02

matlab汪汪队的博客在无线脉冲响应（IIR）数字滤波器设计中，先进行模拟滤波器的设计，然后进行模拟数字滤波器转换，即采取脉冲响应不变法及双线性Z变更法设计数字滤波器，最后进行滤波器的频带转换。在有限脉冲响应（FIR）数字滤波器...
从0开始做有趣的音乐创作
2023-07-31 00:46

光子AI的博客音乐是生活中不可或缺的一部分，它塑造着我们的心灵世界，影响着我们的日常生活、工作和学习。古典音乐、流行音乐、电子乐等各种各样的音乐形式广泛地应用于现代社会，具有丰富的表现力和艺术性。近年来随着科技的...
C#实现WAV音频单声道提取
2014-10-16 15:36

deerleaper的博客通常我们在音像店买回来的VCD或者DVD都是双声道的形式，唱片商在录制唱片时往往提供了两个或多个声道，以保存不同的音频内容，以形成立体声效。左声道保存的大多为一些背景声效，如卡拉OK的消音伴唱。而右声道保存的...
声纹技术（二）：音频信号处理基础【模拟信号（连续）--采样--＞数字信号（离散）--量化--＞振幅简化为整数--编码--＞二进制序列】【WAV音频格式】【SoX】【分帧-加窗-】
2022-06-24 21:29

u013250861的博客在前面的章节里我们就提到过，从学科分类上讲，声纹技术是语音信号处理的一个分支，而语音信号处理则属于音频信号处理这个大类。语音信号和音频信号，这二者的区别在于，前者专指人类说话时所发出的具有社会意义的...
C#调用FFmpeg转换IndexTTS2输出音频为MP3格式
2026-01-04 05:59

脑叔的博客通过C#调用IndexTTS2生成中文语音后，利用FFmpeg将WAV压缩为MP3，显著减小文件体积并提升传输效率。整个流程涵盖HTTP请求合成、音频转换与自动化处理，适用于智能播报、AI客服等场景，兼顾兼容性与性能优化。
pydub 实现音频操作
2024-04-10 11:25

Mr数据杨的博客特别是在自动化音频编辑和背景音乐生成等应用场景中，pydub 展现了卓越的灵活性与效率。无论是批量格式转换、音量标准化，还是生成定制的背景音乐，pydub 都为音频项目的高效管理提供了重要支持。相信读者能够将所学...
语音数字信号处理与分析及Matlab实现
2021-08-27 21:22

sunny_chenxi的博客摘要本设计综合利用数字信号处理的理论知识进行语音信号的频谱分析，通过理论推导得出相应结论，再利用MATLAB作为编程工具进行计算机实现，从而加深对所学知识的理解，建立概念。本次课程设计要求利用MATLAB对语音...
27、走出实验室，融入现实：迈向日常生活中的情绪建模
2025-08-21 02:25

EGG99的博客本研究探讨了在日常生活中被动监测情绪状态的方法，通过结合可穿戴传感器和移动设备，收集心率、皮肤电反应及身体活动数据，并与用户的情绪自我报告相关联，开发出用于情绪识别的模型。研究结果显示，系统在高、低...
LabView声音密码收发实验：图形化编程在安全通信中的应用
2025-07-18 09:10

ArcCl的博客在现代工程与科学研究领域，图形化编程语言LabVIEW提供了一种不同于传统文本编程的独特开发体验。LabVIEW的编程结构基于数据流，通过图形块（称为VI，Virtual Instruments）以及它们之间的连线来实现逻辑控制。这种...
方言保护与 LLM：传承语言文化
2024-11-20 01:27

光子AI的博客《方言保护与LLM：传承语言文化》目录大纲 [文章标题] 关键词：方言保护、语言模型（LLM）、文化多样性、数字化、教育
ComfyUI音乐封面生成：结合音频特征的视觉表达实验
2025-12-14 03:26

京脉圈的博客本文介绍如何利用ComfyUI结合音频特征生成与音乐节奏、...通过提取梅尔频谱图并接入ControlNet，实现从声音到图像的端到端映射，使AI生成的画面结构与音乐脉动同步。系统支持批量处理，提升音乐视觉化的一致性与效率。
【转】java对音频文件的频谱分析
2017-02-15 17:22

A.Star的博客 java对音频文件的频谱分析 MP3音频录音机 MP3音频录音机是一款运行于个人计算机上的功能强大的录音、播放软件。使用它，您可将计算机内部或外部声音（如来自麦克风、线路输入、INTERNET的广播或各影音播放...
植物园温室中ACE-Step生成促进生长的特定频率音乐
2025-12-09 13:36

EdTechIH的博客本文介绍如何利用开源AI音乐模型ACE-Step，通过精准控制声波频率，为植物定制促进生长的专属音乐。结合生物声学机制与智慧农业系统，实现声音刺激下的高效种植，并分享实际部署中的优化策略与未来展望。
金融领域多模态学习在全方位反欺诈中的应用
2025-03-24 04:07

光子AI的博客在金融领域，欺诈行为严重威胁着金融机构...本文的目的在于深入探讨多模态学习在金融全方位反欺诈中的应用，涵盖从核心概念、算法原理到实际应用和未来发展等多个方面，为金融行业的反欺诈实践提供理论支持和技术指导。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月18日

从wav格式音频中提取出某单一频率的信号

3条回答 默认 最新

解决方案

问题事件

3条回答默认最新