不要人工智能GPT回答:
各位好,我用Audition软件和MATLAB分析了两段蟋蟀的鸣声,发现它们主峰的频谱特征,问题如下:
1、用Audition软件分析鸣声1和鸣声2的频谱(如下图1、2),鸣声1主峰频率为3800Hz,鸣声2主峰频率为4500Hz左右,这两段主峰也是基频所在的峰,分离这两段主峰出来跟纯音的3800Hz、4500Hz比较峰形状宽很多、听感也没那么尖锐、单一频率,像是很多频率分量组成的峰,为何这两个主峰有那么多非整数频率汇总一起组成一个峰?是这些非整数倍的频率和基频造成上面鸣声的非纯音感?
2、用MATLAB分析这两段鸣声(截取上面同样长度的信息量)来分析他们的主峰频谱(如下图3、4),发现他们的频谱图跟音频软件Audition分析结果很大不同,主峰窄很多,两个鸣声的主峰中都有一两个的频率幅值高很多,其他频率分量都很多,那MATLAB的分析结果也就证明这主峰是由很多频率成分组成的?主峰中主次频率的幅值相差甚大,如何体现次频率的对整个主峰能量的贡献(听感像多频率组成的)?为何音频软件分析的主峰频率和MATLAB分析的频谱相差如何之大?
3、发现很多物种鸣声、音频、人语言都存在主峰多频率组成这特征?
4、为何平时分析时只提基频、整数倍的谐波代表峰的频,峰里的其他频率不提及?为何不用一定范围的频率代表一个峰?
5、我尝试自己建模,单独比较主峰里几个非整数倍频率的纯音听感觉没区别(例如3800Hz和3850Hz),但把这几音混在一起播放比纯音区别大,不像纯音的听感,跟蟋蟀的鸣声类似,为何有这现象??
以上请扶正!感谢!



