检测音频信号中的语音存在
音频工具箱/测量
的声音活动检测器块检测音频信号中存在的语音。也可以使用声音活动检测器块输出估计的噪声方差每频率箱。
数据类型 |
|
直接喂养 |
|
多维信号 |
|
适应信号 |
|
讨论二阶导数过零检测 |
|
的声音活动检测器实现所描述的算法[1]。
如果输入域被指定为时间
,将输入信号加窗,然后根据变换变换到频域窗口,窗口的侧瓣衰减(DB), 和FFT长度参数。如果输入域被指定为频率
,假设输入是一个音频信号的加窗离散时间傅里叶变换(DTFT)。然后信号被转换到功率域。根据,估计噪声方差[2]。后验信噪比和先验信噪比根据中所述的最小均方误差(MMSE)公式进行估计[3]。采用基于隐马尔可夫模型(HMM)的悬架方案进行对数似然比检验[1]。
孙[1],Jongseo。,Nam Soo Kim, and Wonyong Sung. "A Statistical Model-Based Voice Activity Detection."信号处理字母IEEE。1999年第6卷第1期。
[2]马丁,R。基于最优平滑和最小统计量的噪声功率谱密度估计IEEE语音和音频处理汇刊。Vol. 9, No. 5, 2001, pp. 504-512。
以法莲,Y.,和D.玛拉。使用最小均方误差短时谱振幅估计器的语音增强。声学,语音和信号处理的IEEE交易。第32卷,第6期,1984年,第1109-1121页。