主要内容

使用深度学习的音频处理

利用音频和语音处理应用扩展深度学习工作流

通过使用deep learning Toolbox™和audio Toolbox™,将深度学习应用于音频和语音处理应用程序。有关信号处理应用,请参见使用深度学习的信号处理.有关无线通信中的应用程序,请参见使用深度学习的无线通信

应用程序

音频贴标签机 定义和可视化底层真相标签

功能

全部展开

audioDatastore 收集音频文件的数据存储
audioDataAugmenter 增加音频数据
audioFeatureExtractor 简化音频特征提取
ivectorSystem 创建矢量i系统
openl3Features 提取OpenL3特性
pitchnn 利用深度学习神经网络估计音高
vggishFeatures 提取VGGish特性
classifySound 对音频信号中的声音进行分类
绉神经网络
crepePreprocess 面向CREPE深度学习网络的音频预处理
crepePostprocess CREPE深度学习网络的后处理输出
openl3 OpenL3神经网络
openl3Features 提取OpenL3特性
openl3Preprocess 对音频进行预处理,用于OpenL3特征提取
pitchnn 利用深度学习神经网络估计音高
vggish VGGish神经网络
vggishFeatures 提取VGGish特性
vggishPreprocess 预处理音频进行VGGish特征提取
yamnet YAMNet神经网络
yamnetGraph YAMNet AudioSet本体图
yamnetPreprocess 对音频进行预处理用于YAMNet分类

主题

音频应用深度学习导论(音频工具箱)

学习将深度学习应用于音频应用的常用工具和工作流程。

使用深度学习分类声音(音频工具箱)

训练、验证和测试简单的长短期记忆(LSTM)来分类声音。

使用预先训练的音频网络进行迁移学习

使用迁移学习对YAMNet(一种预训练卷积神经网络,CNN)进行再训练,对一组新的音频信号进行分类。

使用自定义SincNet层和深度学习的说话人识别

使用定制的深度学习层执行语音识别,实现梅尔规模的滤波器组。

使用深度学习网络消除语音干扰

训练一个深度学习模型,去除语音中的混响。

Simulink中的语音命令识别金宝app

使用Simulink检测音频中语音命令的存在金宝app®模型。

基于小波散射和深度学习的语音数字识别

这个例子展示了如何使用机器和深度学习技术对语音数字进行分类。

利用深度学习网络的鸡尾酒会源分离

这个例子展示了如何使用深度学习网络来隔离语音信号。

音频特性的顺序特征选择

这个例子展示了一个典型的工作流特征选择应用于语音数字识别的任务。

使用深度学习学习预强调滤波

使用卷积深度网络学习一个预强调滤波器用于语音识别。

特色的例子