主要内容

机器学习和深度学习音频

数据集管理,标签和增强;音频,语音和声学应用的分段和特征提取

音频工具箱™为音频,语音和声学应用程序开发机器和深度学习解决方案,包括扬声器识别,语音命令识别,声学场景识别等。金宝搏官方网站

  • audiodatastore.以并行摄取大型音频数据集和处理文件。

  • 音频贴标程序通过手动和自动注释音频录制来构建音频数据集。

  • audiodataAugmenter.创建内置或自定义信号处理方法的随机管道,用于增强和合成音频数据集。

  • audiofeatureextractor.在共享中间计算的同时提取不同特征的组合。

Audio Toolbox还提供对第三方API的访问,以获取文本语音和语音到文本,它包括预先训练的VGGASH和YamNet型号,以便您可以执行传输学习,分类声音和提取功能嵌入。使用佩带的网络需要深度学习工具箱™。

特色例子