yamnetgraph..

YAMNet AudioSet本体图

折叠所有页面

语法

ygraph = yamnetGraph

[ygraph，classes] = yamnetgraph

描述

例子

ygraph= yamnetgraph.返回Audioset Intology的定向图。

例子

［ygraph，类] = yamnetgraph.也返回YAMNet支持的类的字符串数组。金宝app

此功能需要Audio Toolbox™和Deep Learing Toolbox™。

例子

全部收缩

下载`yamnetgraph..`

此示例使用：

打开直播脚本

下载并解压缩音频工具箱™对YAMNet的支持。金宝app

类型yamnetgraph..在命令窗口。如果未安装YamNet的音频工具箱支持，则金宝app该函数提供了下载位置的链接。要下载模型，请单击链接。将文件解压缩到MATLAB路径上的位置。

或者，执行以下命令以将yamnet模型下载并解压缩到临时目录。

downloadFolder = fullfile (tempdir,'yamnetdownload'）;loc = websave（downloadFolder，“https://ssd.mathworks.com/金宝appsupportfiles/audio/yamnet.zip”）;YamnetLocation = Tempdir;解压缩（Loc，yamnetLocation）AddPath（FullFile（yamnetLocation，'yamnet'））

通过键入检查安装是否成功yamnetgraph..在命令窗口。如果网络已安装，则该函数返回a有向图目的。

yamnetgraph..

识别本体的主要类别

此示例使用：

打开直播脚本

创建一个有向图对象，该对象描述AudioSet本体。

ygraph = yamnetGraph

ygraph =带有性质的数字：边缘：[670×1表]节点：[632×1表]

可视化本体。本体包含632个单独的类，具有670个连接。

p = plot（ygraph）;布局（P，'分层'）

获取每个声音类的名称。如果声音类没有前辈，则将其标识为本体的主要类别。

节点名= ygraph.Nodes.Name;topCategories = {};为index = 1:numel(nodeNames) pre = pre (ygraph,nodeNames{index});如果isempty（pre）topcategories {end + 1} = nodenames {index};结束结束

将类别作为字符串数组显示。

topCategories =字符串(topCategories)

topcategories =1×7弦“人类声音”“动物”“音乐”“自然声音”“东西的声音”“源 - 模棱两可”的“渠道，环境和背景”

突出显示并标记顶部的类别有向图阴谋。

突出(p topCategories“NodeColor”，“红色”，“Markersize”，8）LabelNode（P，Top类别，Top类别）

绘制动物声音的子图

此示例使用：

打开直播脚本

创建一个有向图代表audioset本体的对象。

ygraph = yamnetGraph;

用dfsearch要执行深度第一图形搜索，以识别类下的所有音频类动物．

animalNodes = dfsearch (ygraph,“动物”）;

用sub创建一个新的有向图对象，该对象只包含已标识的音频类。绘制得到的有向边图。

Anginraph =子图（Yogk，蛛网节）;p = plot（蛛网摄影）;p.nodefontsize = 12;graphfigure = gcf;allow = graphfigure.position;设置（图形文件，“位置”，[旧（1），旧（2），旧（3）* 3，旧（4）* 3]）

用前辈们要确定所有的前人咆哮声音。突出显示图上的前辈。

preIDs =前辈(animalGraph,“咆哮”）

泼妇=4×1的字符串"狗" "猫" "咆哮的猫(狮子，老虎)"“犬科动物、狗、狼”

用强调突出显示咆哮Node和前辈的情节。

突出(p,“咆哮”，“NodeColor”，‘g’，'Markersize'8)突出(p, preIDs“NodeColor”，“r”，'Markersize', 8)

可视化yamnet支持的声音金宝app

此示例使用：

打开直播脚本

创建一个描述AudioSet本体的有向图对象。还返回YAMNet支持的类。金宝app绘制有向图。

[ygraph，classes] = yamnetgraph;p = plot（ygraph）;布局（P，'分层'）

YAMNet预测了完整AudioSet本体的一个子集。显示AudioSet本体中但不可能从YAMNet网络输出的声音类。

audiosetClasses = ygraph.Nodes.Name;classDiff = setdiff (audiosetClasses类)

classDiff =111×1字符串《声学环境》《中音萨克斯管》《背景噪音》《低音(频率范围)》“鲈鱼(仪器角色)”“Bassline”“大管”“Battle cry”“Bay”“Beat”“生日音乐”“Blare”“Booing”“简短的音调”“号角”“猫的交流”“手机嗡嗡声，振动警报”“频道，环境和背景”“花栗鼠”“和弦”“Clavinet”“Clunk”“光盘”“短号”“碰撞钹”“Cumbia”“变形壳”“消化”“家庭声音”home听起来像“驴，驴”⋮

突出显示不可能从YAMNet输出的类。

亮点（P，Classdiff，“NodeColor”，“r”）

分析其中一个主要类别。

categoryToAnalyze =“渠道，环境和背景”；subsetNodes = dfsearch (ygraph categoryToAnalyze);ygraphSubset =子图(ygraph subsetNodes);classToHighlight =相交(classDiff ygraphSubset.Nodes.Name);pSub =情节(ygraphSubset);布局(pSub,'分层'）突出显示（Psub，Classtohighlight，“NodeColor”，“r”）

可视化声课的特异性

此示例使用：

打开直播脚本

创建一个有向图对象，该对象描述AudioSet本体。

ygraph = yamnetGraph;

指定要可视化的声音类，并指定前代和后代的数量。可用的声音类仅是那些作为YAMNet输出支持的类。金宝app如果指定了比本体中更多的前人或后继者，则只显示本体中的前人和后继者。

soundclass =“咆哮”；numPredecessors =3.；numSuccessors =0；pred =最近的（ygraph，soundclass，numpredersors，“方向”，“输入”）;suc =最近的（ygraph，soundclass，numsuccessors，“方向”，“外向”）;子类= [soundclass; pred; suc];ygraphsub = subagraph（ygraph，独特（亚级））;p = plot（ygraphsub）;布局（P，'分层'）突出显示（p，soundclass，'标记'，' d '，“NodeColor”，“红色”，'Markersize'6）

输出参数

全部收缩

`ygraph`-具有有向边的AudioSet本体图
`有向图`对象

带有有向边的AudioSet本体图，返回为有向图目的。

`类`- YAMNet支持金宝app的类
字符串数组

YamNet支持金宝app的类作为字符串数组返回。Yamnet支持的类是A金宝appudioset本体的子集。

提示

谷歌^®提供一个网站，您可以在其中浏览Audioset Ontology和相应的数据集：https://research.google.com/autioset/ontology/index.html.．

参考

[1] Gemmeke，Jort F.等人。“音频集：音频事件的本体和人为标签数据集。”2017 IEEE声学，语音和信号处理国际会议（ICASSP）， IEEE, 2017, pp. 776-80。DOI.org (Crossref), doi: 10.1109 / ICASSP.2017.7952261。

Hershey, Shawn, et al. < CNN大规模音频分类架构>。2017 IEEE声学，语音和信号处理国际会议（ICASSP），IEEE，2017，第131-35页。DOI.org (Crossref)，DOI：10.1109 / ICASSP.2017.7952132。