主要内容

特征提取

Mel谱图,MFCC,音高,谱描述符

从音频信号中提取特征,作为机器学习或深度学习系统的输入。使用单独的功能,例如melSpectrogrammfcc球场,spectralCentroid,或使用audioFeatureExtractor对象创建特征提取管道,以最小化冗余计算。在活动脚本中,使用提取音频功能以图形方式选择要提取的特征。

对象

audioFeatureExtractor 简化音频特征提取
cepstralFeatureExtractor 从音频片段中提取倒谱特征
ivectorSystem 创建矢量i系统

住编辑任务

提取音频功能 在实时编辑器中简化音频特征提取

功能

全部展开

audioDelta 计算三角洲特征
designAuditoryFilterBank 设计听觉滤波器组
melSpectrogram 梅尔·光谱图
audioDelta 计算三角洲特征
cepstralCoefficients 提取cepstral系数
gtcc 提取伽玛酮倒谱系数、能量对数、δ和δ - δ
mfcc 提取音频信号的MFCC, log energy, delta和delta
vggishFeatures 提取VGGish特性
openl3Features 提取OpenL3特性
audioDelta 计算三角洲特征
harmonicRatio 谐波比率
球场 估计音频信号的基频
pitchnn 深度学习神经网络估计基音
audioDelta 计算三角洲特征
spectralCentroid 音频信号和听觉谱图的谱心
spectralCrest 音频信号和听觉谱图的波峰
spectralDecrease 音频信号和听觉谱图的谱降低
spectralEntropy 音频信号和听觉谱图的光谱熵
spectralFlatness 音频信号和听觉谱图的谱平坦度
spectralFlux 音频信号和听觉谱图的光谱通量
spectralKurtosis 音频信号和听觉谱图的谱峰度
spectralRolloffPoint 音频信号和听觉谱图的谱滚点
spectralSkewness 音频信号和听觉谱图的光谱偏度
spectralSlope 音频信号和听觉谱图的谱斜率
spectralSpread 音频信号和听觉谱图的频谱扩展
erb2hz 从等效矩形带宽(ERB)尺度转换为赫兹
bark2hz 转换从树皮规模到赫兹
mel2hz 从梅尔刻度转换为赫兹
hz2erb 从赫兹转换为等效矩形带宽(ERB)尺度
hz2bark 从赫兹转换为巴克规模
hz2mel 从赫兹转换到梅尔尺度
phon2sone 从电话转换成电话
sone2phon 把“电话”换成“电话”

Cepstral特征提取器 从音频片段中提取倒谱特征

主题

光谱描述符

光谱描述符概述及应用。

使用深度学习学习前置重点过滤器

使用卷积深度网络学习语音识别的预强调过滤器。

特色的例子