Audio Toolbox™提供用于开发机器和深度学习解决方案的功能,包括音频,语音和声学应用程序,包括扬声器识别,语音命令识别,声学场景识别等。金宝搏官方网站
采用audioDatastore
以并行摄取大型音频数据集和处理文件。
采用音符贴标程序通过手动和自动注释音频记录来构建音频数据集。
采用audiodataAugmenter.
创建内置或自定义信号处理方法的随机管道,用于增强和合成音频数据集。
采用audioFeatureExtractor
在共享中间计算的同时提取不同特征的组合。
Audio Toolbox还提供了对文本到语音和语音到文本的第三方api的访问,它包括预先训练的VGGish和YAMNet模型,以便您可以执行迁移学习,对声音进行分类,并提取特征嵌入。使用预先训练的网络需要深度学习工具箱™。