主要内容

Pretrained模型

转移学习,合理的分类、功能嵌入pretrained音频深度学习网络

音频工具箱™提供了MATLAB®和仿真软金宝app件®金宝app支持pretrained音频深度学习网络。定位和分类与YAMNet声音,估计与绉音高。提取VGGish或OpenL3功能嵌入的机器学习和深入学习系统的输入。使用矢量i系统产生音频信号的紧凑表示说话人识别等应用程序,验证、识别、和diarization。使用detectspeechnn执行语音活动检测(VAD)。

使用pretrained深入学习网络需要深度学习工具箱™。音频工具箱pretrained网络中可用深层网络设计师(深度学习工具箱)

功能

全部展开

vggishEmbeddings 提取VGGish功能嵌入
vggish VGGish神经网络
vggishPreprocess 预处理对VGGish音频特征提取
classifySound 在音频信号进行分类
yamnet YAMNet神经网络
yamnetGraph 图YAMNet AudioSet本体
yamnetPreprocess 预处理对YAMNet音频分类
openl3Embeddings 提取OpenL3功能嵌入
openl3 OpenL3神经网络
openl3Preprocess 预处理对OpenL3音频特征提取
pitchnn 与深度学习神经网络估计音高
绉神经网络
crepePreprocess 预处理音频绉深度学习网络
crepePostprocess 后处理绉深入学习网络的输出
speakerRecognition Pretrained说话人识别系统
ivectorSystem 创建矢量i系统
detectspeechnn 使用人工智能检测边界的演讲音频信号
vadnet 神经网络的语音活动检测(VAD)
vadnetPreprocess 预处理音频语音活动检测(VAD)网络
vadnetPostprocess 后处理框架和监督概率

全部展开

VGGish嵌入 提取VGGish嵌入
VGGish预处理 预处理对VGGish音频特征提取
VGGish VGGish嵌入提取网络
声音分类器 在音频信号进行分类
YAMNet YAMNet声音分类网络
YAMNet预处理 预处理对YAMNet音频分类
OpenL3嵌入 提取OpenL3嵌入
OpenL3预处理 预处理OpenL3嵌入提取的音频
OpenL3 OpenL3嵌入提取网络
深音高估计量 估计绉深学习神经网络
绉深音高估计神经网络
绉预处理 预处理音频绉深音高估计
绉后处理 后处理绉音高估计网络的输出

应用程序

深层网络设计师 设计、可视化和火车深度学习网络

主题