主要内容

使用深度学习的音频处理

扩展深度学习工作流程与音频和语音处理应用程序

通过使用Deep Learning Toolbox™与Audio Toolbox™一起使用深度学习到音频和语音处理应用程序。对于信号处理应用程序,请参阅使用深度学习的信号处理.对于无线通信的应用,请参阅使用深度学习的无线通信

应用程序

音频贴标签机 定义和可视化地面真理标签

功能

ivectorSystem 创建矢量i系统
绉神经网络
crepePreprocess CREPE深度学习网络的音频预处理
repepostprocess. CREPE深度学习网络的后处理输出
球场 深度学习神经网络估计基音
openl3 OpenL3神经网络
openl3Preprocess 预处理音频用于OpenL3特征提取
openl3Features 提取OpenL3特性
audioDatastore 用于收集音频文件的数据存储
audioDataAugmenter 增强音频数据
audioFeatureExtractor 简化音频特征提取
vggishPreprocess 预处理音频用于VGGish特征提取
vggishFeatures 提取VGGish特性
vggish VGGish神经网络
yamnet. YAMNet神经网络
yamnetPreprocess 用于yamnet分类的预处理音频
yamnetGraph YAMNet AudioSet本体图
classifySound 对音频信号中的声音进行分类

主题

音频应用深度学习简介(音频工具箱)

学习将深度学习应用于音频应用的常用工具和工作流程。

使用深度学习分类声音(音频工具箱)

训练、验证和测试一个简单的长短期记忆(LSTM)来分类声音。

通过预先训练的音频网络进行迁移学习(音频工具箱)

使用转移学习培训yamnet,预先覆盖的卷积神经网络(CNN),用于对新的一组音频信号进行分类。

使用自定义自信网络层和深度学习识别说话人(音频工具箱)

使用自定义深度学习层进行语音识别,该层实现了梅尔尺度滤波器组。

使用深度学习网络消除语音干扰(音频工具箱)

训练一个深度学习模型,消除语音中的混响。

Simulink中的语音命令识别金宝app(音频工具箱)

使用Simulink检测音频中语音命令的存在金宝app®模型。

特色的例子