主要内容

yamnetgraph..

YAMNet AudioSet本体图

    描述

    例子

    ygraph= yamnetgraph.返回Audioset Intology的定向图。

    例子

    ygraph] = yamnetgraph.也返回YAMNet支持的类的字符串数组。金宝app

    此功能需要Audio Toolbox™和Deep Learing Toolbox™。

    例子

    全部收缩

    下载并解压缩音频工具箱™对YAMNet的支持。金宝app

    类型yamnetgraph..在命令窗口。如果未安装YamNet的音频工具箱支持,则金宝app该函数提供了下载位置的链接。要下载模型,请单击链接。将文件解压缩到MATLAB路径上的位置。

    或者,执行以下命令以将yamnet模型下载并解压缩到临时目录。

    downloadFolder = fullfile (tempdir,'yamnetdownload');loc = websave(downloadFolder,“https://ssd.mathworks.com/金宝appsupportfiles/audio/yamnet.zip”);YamnetLocation = Tempdir;解压缩(Loc,yamnetLocation)AddPath(FullFile(yamnetLocation,'yamnet'))

    通过键入检查安装是否成功yamnetgraph..在命令窗口。如果网络已安装,则该函数返回a有向图目的。

    yamnetgraph..

    创建一个有向图对象,该对象描述AudioSet本体。

    ygraph = yamnetGraph
    ygraph =带有性质的数字:边缘:[670×1表]节点:[632×1表]

    可视化本体。本体包含632个单独的类,具有670个连接。

    p = plot(ygraph);布局(P,'分层'

    获取每个声音类的名称。如果声音类没有前辈,则将其标识为本体的主要类别。

    节点名= ygraph.Nodes.Name;topCategories = {};index = 1:numel(nodeNames) pre = pre (ygraph,nodeNames{index});如果isempty(pre)topcategories {end + 1} = nodenames {index};结束结束

    将类别作为字符串数组显示。

    topCategories =字符串(topCategories)
    topcategories =1×7弦“人类声音”“动物”“音乐”“自然声音”“东西的声音”“源 - 模棱两可”的“渠道,环境和背景”

    突出显示并标记顶部的类别有向图阴谋。

    突出(p topCategories“NodeColor”“红色”“Markersize”,8)LabelNode(P,Top类别,Top类别)

    创建一个有向图代表audioset本体的对象。

    ygraph = yamnetGraph;

    dfsearch要执行深度第一图形搜索,以识别类下的所有音频类动物

    animalNodes = dfsearch (ygraph,“动物”);

    sub创建一个新的有向图对象,该对象只包含已标识的音频类。绘制得到的有向边图。

    Anginraph =子图(Yogk,蛛网节);p = plot(蛛网摄影);p.nodefontsize = 12;graphfigure = gcf;allow = graphfigure.position;设置(图形文件,“位置”,[旧(1),旧(2),旧(3)* 3,旧(4)* 3])

    前辈们要确定所有的前人咆哮声音。突出显示图上的前辈。

    preIDs =前辈(animalGraph,“咆哮”
    泼妇=4×1的字符串"狗" "猫" "咆哮的猫(狮子,老虎)"“犬科动物、狗、狼”

    强调突出显示咆哮Node和前辈的情节。

    突出(p,“咆哮”“NodeColor”‘g’'Markersize'8)突出(p, preIDs“NodeColor”“r”'Markersize', 8)

    创建一个描述AudioSet本体的有向图对象。还返回YAMNet支持的类。金宝app绘制有向图。

    [ygraph,classes] = yamnetgraph;p = plot(ygraph);布局(P,'分层'

    YAMNet预测了完整AudioSet本体的一个子集。显示AudioSet本体中但不可能从YAMNet网络输出的声音类。

    audiosetClasses = ygraph.Nodes.Name;classDiff = setdiff (audiosetClasses类)
    classDiff =111×1字符串《声学环境》《中音萨克斯管》《背景噪音》《低音(频率范围)》“鲈鱼(仪器角色)”“Bassline”“大管”“Battle cry”“Bay”“Beat”“生日音乐”“Blare”“Booing”“简短的音调”“号角”“猫的交流”“手机嗡嗡声,振动警报”“频道,环境和背景”“花栗鼠”“和弦”“Clavinet”“Clunk”“光盘”“短号”“碰撞钹”“Cumbia”“变形壳”“消化”“家庭声音”home听起来像“驴,驴”⋮

    突出显示不可能从YAMNet输出的类。

    亮点(P,Classdiff,“NodeColor”“r”

    分析其中一个主要类别。

    categoryToAnalyze =“渠道,环境和背景”;subsetNodes = dfsearch (ygraph categoryToAnalyze);ygraphSubset =子图(ygraph subsetNodes);classToHighlight =相交(classDiff ygraphSubset.Nodes.Name);pSub =情节(ygraphSubset);布局(pSub,'分层')突出显示(Psub,Classtohighlight,“NodeColor”“r”

    创建一个有向图对象,该对象描述AudioSet本体。

    ygraph = yamnetGraph;

    指定要可视化的声音类,并指定前代和后代的数量。可用的声音类仅是那些作为YAMNet输出支持的类。金宝app如果指定了比本体中更多的前人或后继者,则只显示本体中的前人和后继者。

    soundclass =“咆哮”;numPredecessors =3.;numSuccessors =0;pred =最近的(ygraph,soundclass,numpredersors,“方向”“输入”);suc =最近的(ygraph,soundclass,numsuccessors,“方向”“外向”);子类= [soundclass; pred; suc];ygraphsub = subagraph(ygraph,独特(亚级));p = plot(ygraphsub);布局(P,'分层')突出显示(p,soundclass,'标记'' d '“NodeColor”“红色”'Markersize'6)

    输出参数

    全部收缩

    带有有向边的AudioSet本体图,返回为有向图目的。

    YamNet支持金宝app的类作为字符串数组返回。Yamnet支持的类是A金宝appudioset本体的子集。

    提示

    谷歌®提供一个网站,您可以在其中浏览Audioset Ontology和相应的数据集:https://research.google.com/autioset/ontology/index.html.

    参考

    [1] Gemmeke,Jort F.等人。“音频集:音频事件的本体和人为标签数据集。”2017 IEEE声学,语音和信号处理国际会议(ICASSP), IEEE, 2017, pp. 776-80。DOI.org (Crossref), doi: 10.1109 / ICASSP.2017.7952261。

    Hershey, Shawn, et al. < CNN大规模音频分类架构>。2017 IEEE声学,语音和信号处理国际会议(ICASSP),IEEE,2017,第131-35页。DOI.org (Crossref),DOI:10.1109 / ICASSP.2017.7952132。

    介绍了R2020b