Audio Toolbox™提供了使用机器学习和深度学习来开发音频、语音和声学应用程序的功能。使用audioDatastore
管理和加载大型数据集。使用音频贴标签机以互动的方式定义和形象化地面真相。使用audioDataAugmenter
使用特定于音频的增强技术来扩大数据集。使用audioFeatureExtractor
创建高效和模块化的特征提取管道。
音频贴标签机 | 定义并可视化基本事实标签 |
提取音频功能 | 流线音频特征提取在现场编辑器 |
声音活动检测器 | 检测音频信号的语音存在 |
Cepstral特征提取器 | 从音频段中提取倒谱特征 |
响度计 | 符合标准的响度测量 |
交互式地定义和可视化音频数据集的基本事实标签。
在MATLAB中进行语音到文本的转录®使用第三方基于云的API。
使用第三方基于云的api在MATLAB中执行文本到语音的转换。
光谱描述符的概述和应用。