主要内容

特征提取

梅尔谱图,MFCC,音高,谱描述符

从音频信号中提取特征,作为机器学习或深度学习系统的输入。使用单独的函数,例如melSpectrogrammfcc球场,spectralCentroid,或使用audioFeatureExtractor对象来创建最小化冗余计算的特征提取管道。在实时脚本中,使用提取音频功能图形化地选择要提取的特征。

对象

audioFeatureExtractor 简化音频特征提取
cepstralFeatureExtractor 从音频片段中提取倒谱特征
ivectorSystem 创建矢量i系统

住编辑任务

提取音频功能 简化实时编辑器中的音频特征提取

功能

全部展开

audioDelta 计算三角洲特征
designAuditoryFilterBank 设计听觉滤波器组
melSpectrogram 梅尔·光谱图
audioDelta 计算三角洲特征
cepstralCoefficients 提取cepstral系数
gtcc 提取伽玛酮倒谱系数,对数能量,δ和δ - δ
mfcc 提取音频信号的MFCC、log能量、delta和delta-delta
vggishFeatures 提取VGGish特性
openl3Features 提取OpenL3特性
audioDelta 计算三角洲特征
harmonicRatio 谐波比率
球场 估计音频信号的基频
pitchnn 用深度学习神经网络估计音高
audioDelta 计算三角洲特征
spectralCentroid 音频信号和听觉谱图的谱质心
spectralCrest 音频信号和听觉谱图的谱峰
spectralDecrease 音频信号和听觉谱图的谱降低
spectralEntropy 音频信号和听觉谱图的谱熵
spectralFlatness 音频信号和听觉谱图的谱平坦度
spectralFlux 音频信号和听觉谱图的谱通量
spectralKurtosis 音频信号和听觉谱图的谱峰度
spectralRolloffPoint 音频信号和听觉谱图的谱滚落点
spectralSkewness 音频信号和听觉谱图的谱偏度
spectralSlope 音频信号和听觉谱图的谱斜率
spectralSpread 音频信号和听觉谱图的谱扩频
erb2hz 从等效矩形带宽(ERB)尺度转换为赫兹
bark2hz 从树皮刻度转换为赫兹
mel2hz 从梅尔尺度转换为赫兹
hz2erb 从赫兹转换为等效矩形带宽(ERB)尺度
hz2bark 从赫兹转换为树皮尺度
hz2mel 从赫兹转换为梅尔尺度
phon2sone 把phon转换成sone
sone2phon 把sone转换成phon

Cepstral特征提取器 从音频片段中提取倒谱特征

主题

光谱描述符

光谱描述符概述及应用。

特色的例子