主要内容

Pretrained网络

迁移学习,声音分类,特征嵌入

音频工具箱™提供了预先训练的VGGish和YAMNet网络。使用vggishyamnet在MATLAB函数®YAMNet在仿真软件金宝app®直接与预先训练的网络交互。的classifySound函数的MATLAB和声音分类器块执行所需的预处理金宝app和后处理的YAMNet,以便您可以定位和分类声音到521个类别之一。的声音分类器块相当于级联的YAMNet预处理块和YAMNet块。您可以使用yamnetGraph函数。的vggishFeatures函数为VGGish执行必要的预处理和后处理,以便您可以提取特征嵌入输入到机器学习和深度学习系统。

此功能需要深度学习工具箱™。

功能

全部展开

vggishFeatures 提取VGGish特性
vggish VGGish神经网络
vggishPreprocess 预处理音频进行VGGish特征提取
classifySound 对音频信号中的声音进行分类
yamnet YAMNet神经网络
yamnetGraph YAMNet AudioSet本体图
yamnetPreprocess 对音频进行预处理用于YAMNet分类
openl3 OpenL3神经网络
openl3Preprocess 对音频进行预处理,用于OpenL3特征提取
openl3Features 提取OpenL3特性
绉神经网络
crepePreprocess 面向CREPE深度学习网络的音频预处理
crepePostprocess CREPE深度学习网络的后处理输出
pitchnn 利用深度学习神经网络估计音高
ivectorSystem 创建矢量i系统
speakerRecognition 预先训练的说话人识别系统

声音分类器 对音频信号中的声音进行分类
YAMNet YAMNet声音分类网络
YAMNet预处理 对音频进行预处理用于YAMNet分类

特色的例子