人工智能的音频
数据集管理、标签和扩充;音频分割和特征提取,演讲,和声学的应用程序
音频工具箱™提供音频功能开发机器和深度学习解决方案,演讲,和声学应用包括说话人识别、语音命令识别,语音分离,声场景识别,去噪,和许多更多。金宝搏官方网站
使用
audioDatastore
摄取大量的音频数据集和过程文件并行。使用信号贴标签机建立音频数据集通过注释手动和自动录音。
使用
audioDataAugmenter
创建随机增加管道的内置或自定义信号处理方法和合成音频数据集。使用
audioFeatureExtractor
提取不同的特性而共享中间计算的组合。
音频工具箱还提供了访问第三方api用于语音合成和语音识别,和它包括pretrained模型,这样您就可以执行转移学习分类的声音,嵌入和提取特征。使用pretrained网络需要深度学习工具箱™。
类别
- 应用程序
人工智能工作流应用于音频应用程序 - 数据集管理和标签
摄取、创建和标签大型数据集 - 特征提取
梅尔光谱图、MFCC音高,光谱描述符 - 数据增加
增加管道、改变音高和时间、延伸时间、控制体积和噪音 - 分割
检测和隔离的演讲和其他声音 - Pretrained模型
转移学习,合理的分类、功能嵌入pretrained音频深度学习网络 - 语音转录和合成
使用pretrained模型或第三方api用于语音合成和语音识别 - 代码生成和GPU的支持金宝app
生成可移植的C / c++ /墨西哥人的功能和使用gpu来部署或加速处理