Pretrained模型

转移学习,合理的分类、功能嵌入pretrained音频深度学习网络

音频工具箱™提供了MATLAB^®和仿真软金宝app件^®金宝app支持pretrained音频深度学习网络。定位和分类与YAMNet声音,估计与绉音高。提取VGGish或OpenL3功能嵌入的机器学习和深入学习系统的输入。使用矢量i系统产生音频信号的紧凑表示说话人识别等应用程序,验证、识别、和diarization。使用detectspeechnn执行语音活动检测(VAD)。

使用pretrained深入学习网络需要深度学习工具箱™。音频工具箱pretrained网络中可用深层网络设计师(深度学习工具箱)。

功能

全部展开

VGGish

`vggishEmbeddings`	提取VGGish功能嵌入
`vggish`	VGGish神经网络
`vggishPreprocess`	预处理对VGGish音频特征提取

YAMNet

`classifySound`	在音频信号进行分类
`yamnet`	YAMNet神经网络
`yamnetGraph`	图YAMNet AudioSet本体
`yamnetPreprocess`	预处理对YAMNet音频分类

OpenL3

`openl3Embeddings`	提取OpenL3功能嵌入
`openl3`	OpenL3神经网络
`openl3Preprocess`	预处理对OpenL3音频特征提取

绉

`pitchnn`	与深度学习神经网络估计音高
`绉`	绉神经网络
`crepePreprocess`	预处理音频绉深度学习网络
`crepePostprocess`	后处理绉深入学习网络的输出

i-Vectors

`speakerRecognition`	Pretrained说话人识别系统
`ivectorSystem`	创建矢量i系统

通过采用

`detectspeechnn`	使用人工智能检测边界的演讲音频信号
`vadnet`	神经网络的语音活动检测(VAD)
`vadnetPreprocess`	预处理音频语音活动检测(VAD)网络
`vadnetPostprocess`	后处理框架和监督概率

块

全部展开

VGGish

VGGish嵌入	提取VGGish嵌入
VGGish预处理	预处理对VGGish音频特征提取
VGGish	VGGish嵌入提取网络

YAMNet

声音分类器	在音频信号进行分类
YAMNet	YAMNet声音分类网络
YAMNet预处理	预处理对YAMNet音频分类

OpenL3

OpenL3嵌入	提取OpenL3嵌入
OpenL3预处理	预处理OpenL3嵌入提取的音频
OpenL3	OpenL3嵌入提取网络

绉

深音高估计量	估计绉深学习神经网络
绉	绉深音高估计神经网络
绉预处理	预处理音频绉深音高估计
绉后处理	后处理绉音高估计网络的输出

应用程序

深层网络设计师

设计、可视化和火车深度学习网络

主题

音频传输学习使用实验管理器
配置一个实验,比较了多个pretrained网络的性能应用于语音命令识别使用转移学习任务。
人类的声音在Android设备上使用YAMNet进行分类(金宝app仿真软件金宝app支持Android设备的包)
这个例子展示了如何使用仿真软件®支持Android™设备和一个包pr金宝appetrai金宝appned YAMNet网络对人类的声音进行分类。