主要内容

使用深度学习的音频处理

通过音频和语音处理应用程序扩展深度学习工作流

通过使用深度学习工具箱™和音频工具箱™,将深度学习应用于音频和语音处理应用。有关信号处理应用,请参阅利用深度学习进行信号处理.有关无线通讯的应用,请参阅使用深度学习的无线通信

应用程序

音频贴标机 定义和可视化地面真相标签

功能

驱动系统 创建i向量系统
绉纱 绉纱神经网络
绉纱再加工 绉纱深度学习网络的音频预处理
crepePostprocess 绉纱深度学习网络的后处理输出
pitchnn 基于深度学习神经网络的基音估计
openl3 OpenL3神经网络
OpenL3预处理 用于OpenL3特征提取的音频预处理
openl3Features 提取OpenL3功能
音频数据存储 用于收集音频文件的数据存储
音频数据增强器 增加音频数据
音频特征提取器 流线型音频特征提取
VGG预处理 用于VGGish特征提取的音频预处理
VGISH特性 提取VGGish特征
VGISH VGISH神经网络
yamnet YAMNet神经网络
YAMNET预处理 预处理音频,用于YAMNet分类
阴阳图 YAMNet音频集本体图
分类声音 音频信号中的声音分类

话题

音频应用的深度学习简介(音频工具箱)

了解将深度学习应用于音频应用程序的常用工具和工作流。

使用深度学习对声音进行分类(音频工具箱)

训练、验证和测试一个简单的长-短期记忆(LSTM)来分类声音。

基于预训练音频网络的迁移学习(音频工具箱)

使用迁移学习来重新训练YAMNet,一个预先训练的卷积神经网络(CNN),对一组新的音频信号进行分类。

基于自定义SincNet层和深度学习的说话人识别(音频工具箱)

使用实现mel比例滤波器组的自定义深度学习层执行语音识别。

使用深度学习网络消除语音冗余(音频工具箱)

训练一个深度学习模型,消除语音中的混响。

Simulink中的语音命令识别金宝app(音频工具箱)

使用Simulink检测音频中是否存在语音命令金宝app®模型

特色实例