使用深度学习的音频处理

扩展深度学习工作流程与音频和语音处理应用程序

通过使用深度学习工具箱™和音频工具箱™,将深度学习应用于音频和语音处理应用。

应用程序

音频贴标签机 定义和可视化地面真相标签

功能

audioDatastore 用于收集音频文件的数据存储
audioDataAugmenter 增加音频数据
audioFeatureExtractor 简化音频特征提取
vggishFeatures 提取VGGish特性
vggish VGGish神经网络
yamnet YAMNet神经网络
yamnetGraph YAMNet AudioSet本体图
classifySound 对音频信号中的声音进行分类

主题

音频应用深度学习简介(音频工具箱)

学习将深度学习应用于音频应用的常用工具和工作流程。

使用深度学习分类声音(音频工具箱)

训练、验证和测试一个简单的长短期记忆(LSTM)来分类声音。

通过预先训练的音频网络进行迁移学习(音频工具箱)

使用迁移学习来重新训练YAMNet,一个预先训练的卷积神经网络(CNN),对一组新的音频信号进行分类。

特色的例子