主要内容

声音分类器

在音频信号进行分类

  • 库:
  • 音频工具箱/深度学习

描述

声音分类器块使用YAMNet将音频段划分为类AudioSet本体所描述的声音。的声音分类器块结合必要的音频预处理和YAMNet网络推理。块返回预测声音标签,预测分数的声音,和类标签预测分数。

港口

输入

全部展开

声音数据分类,指定为一个一个频道的信号(列向量)。如果输入信号的采样率(Hz)是16 e3,没有任何限制输入帧长度。如果输入信号的采样率(Hz)不同于16 e3,然后输入帧长度必须大量毁灭的多个因素的重采样操作块执行。如果输入帧长度不满足这个条件,块抛出一个错误消息与信息大量毁灭的因素。

数据类型:|

输出

全部展开

预测声音标签,作为枚举标量返回。

数据类型:枚举

预测激活或得分值为每个支持的声音标签,作为1 -到- 521返回向量,521是YAMNet类金宝app的数量。

数据类型:

类标签预测分数,作为1 -到- 521返回向量。

数据类型:枚举

参数

全部展开

指定输入信号的采样率作为一个积极的标量赫兹。如果采样率不同于16 e3,然后重新取样信号到16块e3, YAMNet支持的采样率。金宝app

数据类型:|

指定重叠之间的比例连续梅尔·色作为标量范围在[0 100)。

数据类型:|

使输出端口声音输出分类的声音。

使输出端口分数标签,输出相关联的所有预测分数和类标签。

块特征

数据类型

|

直接引线

没有

多维信号

没有

适应信号

没有

讨论二阶导数过零检测

没有

算法

全部展开

声音分类器块算法包括两个步骤:

  1. 预处理——YAMNet特定的预处理。生成梅尔·色。

  2. 预测,预测的声音,输入信号的分数,和标签使用YAMNet声音分类网络。

扩展功能

介绍了R2021b