主要内容

特征提取

Mel谱图,MFCC,音高,谱描述符

从音频信号提取功能,用作机器学习或深度学习系统的输入。使用单个功能,例如MELSPECTROGGROP.mfcc球场,Spectralcentroid.,或使用audioFeatureExtractor对象创建一个功能提取管道,最大限度地减少冗余计算。在实时脚本中,使用提取音频功能以图形方式选择要提取的特征。

对象

audioFeatureExtractor 简化音频特征提取
CepstralFeatureextractor. 从音频片段中提取倒谱特征
vietorsystem. 创建I矢量系统

实时编辑任务

提取音频功能 Streamline在Live编辑器中的音频功能提取

职能

全部展开

audioDelta 计算三角洲特征
DesignAuditionFilterBank. 设计听觉过滤器银行
MELSPECTROGGROP. 梅尔·光谱图
audioDelta 计算三角洲特征
cepstralCoefficients 提取cepstral系数
GTCC. 提取伽玛酮倒谱系数、能量对数、δ和δ - δ
mfcc 提取音频信号的MFCC, log energy, delta和delta
vggishFeatures 提取VAGATH特征
OpenL3Features. 提取OpenL3功能
audioDelta 计算三角洲特征
handonicratio 谐波比率
球场 估计音频信号的基本频率
pitchnn 深度学习神经网络估算音高
audioDelta 计算三角洲特征
Spectralcentroid. 音频信号和听觉谱图的光谱质心
光谱 音频信号和听觉谱图的波峰
光谱炸弹 音频信号和听觉谱图的光谱减少
spectralEntropy 音频信号和听觉谱图的光谱熵
spectralFlatness 音频信号和听觉谱图的光谱平整度
spectralFlux 音频信号和听觉谱图的光谱通量
Spectarkurtosis 音频信号和听觉谱图的光谱峰度
spectralrolloffpoint. 音频信号和听觉谱图的谱滚点
spectralSkewness 音频信号和听觉谱图的光谱偏斜
谱图 音频信号和听觉谱图的谱斜率
spectralSpread 音频信号和听觉谱图的频谱扩展
erb2hz 从等效的矩形带宽(ERB)比例转换为赫兹
bark2hz 从树皮量表转换为赫兹
mel2hz 从梅尔规模转换为赫兹
hz2erb 从赫兹转换为等效矩形带宽(ERB)刻度
HZ2Bark. 从赫兹转换为树皮量表
Hz2mel. 从赫兹转换到梅尔尺度
phon2sone 从电话转换成电话
sone2phon. 从SONE转换为PHON

Cepstral特征提取器 从音频片段中提取倒谱特征

话题

光谱描述符

谱描述符的概述和应用。

使用深度学习学习前置重点过滤器

使用卷积的深网络来学习用于语音识别的预重点过滤器。

特色例子