谐波比例
如上所述计算谐波比[1]。以下算法独立应用于每个音频数据窗口。信号的归一化自相关的确定为:
在哪里
S.是单一的音频数据帧N.元素。
m计算中的最大滞后。最大滞后为40毫秒,其对应于25Hz的最小频率。
在给定范围内确定谐波比的第一估计是归一化自相关的最大值:
在哪里m0.是搜索范围的下边缘,被确定为归一化自相关的第一零交叉。
最后,使用抛物线插值改善谐波比率估计,如[2]。
[1] Kim,Hyoung-Gook,Nicholas Moreau和Thomas Sikora。MPEG-7音频及更大:音频内容索引和检索。John Wiley&Sons,2005。
[2]光谱峰的二次插值。访问2018年10月11日。https://ccrma.stanford.edu/~jos/sasp/quadratic_interpolation_spectral_peaks.html