提取MFCC,Log Energy,Delta和Delta-Delta的音频信号gydF4y2Ba
返回音频输入的mel频率倒频谱系数(MFCCs),采样频率为gydF4y2Ba多项式系数gydF4y2Ba
= MFCC(gydF4y2Ba奥地策gydF4y2Ba
,gydF4y2BafsgydF4y2Ba
)gydF4y2BafsgydF4y2Ba
赫兹。gydF4y2Ba
使用一个或多个指定选项gydF4y2Ba多项式系数gydF4y2Ba
= MFCC(gydF4y2Ba___gydF4y2Ba,gydF4y2Ba名称,值gydF4y2Ba
)gydF4y2Ba名称,值gydF4y2Ba
对论点。gydF4y2Ba
Coeffs = MFCC(AudioIn,FS,'Logenergy','替换')gydF4y2Ba
返回用于采样的音频输入信号的MEL频率谱系齐数gydF4y2BafsgydF4y2Ba
赫兹。第一个系数gydF4y2Ba多项式系数gydF4y2Ba
向量被替换成对数能量值。gydF4y2Ba
[gydF4y2Ba
还返回与每个数据窗口对应的样本的Delta,delta-delta和位置。gydF4y2Ba多项式系数gydF4y2Ba
,gydF4y2Ba三角洲gydF4y2Ba
,gydF4y2BadeltadeltagydF4y2Ba
,gydF4y2Ba座垫gydF4y2Ba
] = MFCC(gydF4y2Ba___gydF4y2Ba)gydF4y2Ba
MEL频率谱系数是从语音信号中提取的流行功能,以便用于识别任务。在语音源滤波器模型中,临时谱系数应理解为代表过滤器(声道)。声带频率响应相对平滑,而浊音的来源可以被建模为脉冲列车。结果,可以通过语音段的光谱包络估计声道。gydF4y2Ba
MEL频率谱系数的激励思想是基于对耳蜗的理解将关于声道(平滑光谱)的信息压缩成少数系数。虽然没有用于计算系数的硬标准,但图表概述了基本步骤。gydF4y2Ba
默认的mel滤波器组线性空间的前10个三角形滤波器和对数空间的其余滤波器。gydF4y2Ba
在第零梅尔频率倒谱系数中所包含的信息常被对数能量增加或取代。对数能量的计算取决于输入域。gydF4y2Ba
如果输入(gydF4y2Ba奥地策gydF4y2Ba)是一个时域信号,使用以下等式计算日志能量:gydF4y2Ba
如果输入(gydF4y2Ba奥地策gydF4y2Ba)是一个频域信号,使用以下等式计算日志能量:gydF4y2Ba
[1] Rabiner,Lawrence R.和Ronald W. Schafer。gydF4y2Ba数字语音处理的理论与应用gydF4y2Ba.上鞍河,NJ:皮尔森,2010。gydF4y2Ba
audiodetta.gydF4y2Ba
|gydF4y2Baaudiofeatureextractor.gydF4y2Ba
|gydF4y2Ba抗痉挛特征提取器gydF4y2Ba|gydF4y2BaCepstralcoeffients.gydF4y2Ba
|gydF4y2BadetectSpeechgydF4y2Ba