主要内容

人工智能的音频

数据集管理、标签和扩充;音频分割和特征提取,演讲,和声学的应用程序

音频工具箱™提供音频功能开发机器和深度学习解决方案,演讲,和声学应用包括说话人识别、语音命令识别,语音分离,声场景识别,去噪,和许多更多。金宝搏官方网站

  • 使用audioDatastore摄取大量的音频数据集和过程文件并行。

  • 使用信号贴标签机建立音频数据集通过注释手动和自动录音。

  • 使用audioDataAugmenter创建随机增加管道的内置或自定义信号处理方法和合成音频数据集。

  • 使用audioFeatureExtractor提取不同的特性而共享中间计算的组合。

音频工具箱还提供了访问第三方api用于语音合成和语音识别,和它包括pretrained模型,这样您就可以执行转移学习分类的声音,嵌入和提取特征。使用pretrained网络需要深度学习工具箱™。

类别