声音分类器

在音频信号进行分类

扩展所有的页面

库:
音频工具箱/深度学习

描述

的声音分类器块使用YAMNet将音频段划分为类AudioSet本体所描述的声音。的声音分类器块结合必要的音频预处理和YAMNet网络推理。块返回预测声音标签,预测分数的声音,和类标签预测分数。

港口

输入

全部展开

`audioIn`——声音数据
列向量

声音数据分类,指定为一个一个频道的信号(列向量)。如果输入信号的采样率(Hz)是16 e3,没有任何限制输入帧长度。如果输入信号的采样率(Hz)不同于16 e3,然后输入帧长度必须大量毁灭的多个因素的重采样操作块执行。如果输入帧长度不满足这个条件,块抛出一个错误消息与信息大量毁灭的因素。

数据类型:单|双

输出

全部展开

`声音`——预测声音标签
枚举标量

预测声音标签,作为枚举标量返回。

数据类型:枚举

`分数`——预测激活或分数
向量

预测激活或得分值为每个支持的声音标签,作为1 -到- 521返回向量,521是YAMNet类金宝app的数量。

数据类型:单

`标签`——预测类标签的分数
向量

类标签预测分数,作为1 -到- 521返回向量。

数据类型:枚举

参数

全部展开

`输入信号的采样率(Hz)`- - - - - -输入信号的采样率赫兹
`16 e3`(默认)|积极的标量

指定输入信号的采样率作为一个积极的标量赫兹。如果采样率不同于16 e3,然后重新取样信号到16块e3, YAMNet支持的采样率。金宝app

数据类型:单|双

`重叠的百分比(%)`——连续梅尔·色之间的重叠部分
`50`0(默认)| (100)

指定重叠之间的比例连续梅尔·色作为标量范围在[0 100)。

数据类型:单|双

`分类`——选择输出声音分类
`在`(默认)|`从`

使输出端口声音输出分类的声音。

`预测`——输出所有成绩和相关的标签
`从`(默认)|`在`

使输出端口分数和标签,输出相关联的所有预测分数和类标签。

模型的例子

在仿真软件使用YAMNet检测音金宝app乐

发现音乐使用声音分类器在仿真软件金宝app^®。

比较健全的分类器与等效YAMNet块街区

显示良好的级联分类器块相当于YAMNet预处理块和YAMNet块。

块特征

数据类型	`双`\|`单`
直接引线	`没有`
多维信号	`没有`
适应信号	`没有`
讨论二阶导数过零检测	`没有`

算法

全部展开

的声音分类器块算法包括两个步骤:

预处理——YAMNet特定的预处理。生成梅尔·色。
预测,预测的声音,输入信号的分数,和标签使用YAMNet声音分类网络。

预处理

投audioIn单,重新取样16赫兹。
计算片面的短时傅里叶变换)使用25 ms周期性损害窗口(400个样本),10 ms跳DFT(160个样本)和512点。
把复杂的光谱值大小和丢弃相位信息。
片面的级STFTs穿过64 -带mel-spaced滤波器银行。这样做将257 - STFT向量长度64 -梅尔向量的长度。
64 -长度向量转换为对数尺度。
缓冲的向量到输出大小由- 64,96 - 96是10 ms帧的数量在每个梅尔光谱图和64是梅尔乐队的数量。连续重叠96 - 64年-梅尔·色是由价值决定的重叠的百分比(%)参数。

预测

这些96 -,- 64色传递到YAMNet块。YAMNet块最大的三个输出:

声音的标签:最可能的声音。你得到一个“声音”为每个96 -,- 64光谱图输入。
分数:1 -到- 512向量,得分值为每个支持的声音标签。金宝app
标签:1 -到- 521包含声音标签向量。

扩展功能

C / c++代码生成
使用仿真软件生成C和c++代码®编码器™。金宝app

使用笔记和限制:

的语言参数配置参数>代码生成必须设置为一般类别c++。
ERT-based目标的金宝app支持:适应信号参数代码生成>接口必须启用窗格。
的网络层支持代码生成,明白了金宝app网络层支持代码生成金宝app(MATLAB编码器)。

另请参阅

介绍了R2021b

音频工具箱文档

金宝app

试着用MATLAB仿真软金宝app件,和其他产品下载188bet金宝搏

得到审判现在

声音分类器

描述

港口

输入

audioIn——声音数据列向量

输出

声音——预测声音标签枚举标量

分数——预测激活或分数向量

标签——预测类标签的分数向量

参数

输入信号的采样率(Hz)- - - - - -输入信号的采样率赫兹16 e3(默认)|积极的标量

重叠的百分比(%)——连续梅尔·色之间的重叠部分500(默认)| (100)

分类——选择输出声音分类在(默认)|从

预测——输出所有成绩和相关的标签从(默认)|在

模型的例子

在仿真软件使用YAMNet检测音金宝app乐

比较健全的分类器与等效YAMNet块街区

块特征

算法

预处理

预测

扩展功能

C / c++代码生成使用仿真软件生成C和c++代码®编码器™。金宝app

另请参阅

应用程序

块

功能

音频工具箱文档

金宝app

试着用MATLAB仿真软金宝app件,和其他产品下载188bet金宝搏

`audioIn`——声音数据
列向量

`声音`——预测声音标签
枚举标量

`分数`——预测激活或分数
向量

`标签`——预测类标签的分数
向量

`输入信号的采样率(Hz)`- - - - - -输入信号的采样率赫兹
`16 e3`(默认)|积极的标量

`重叠的百分比(%)`——连续梅尔·色之间的重叠部分
`50`0(默认)| (100)

`分类`——选择输出声音分类
`在`(默认)|`从`

`预测`——输出所有成绩和相关的标签
`从`(默认)|`在`

C / c++代码生成
使用仿真软件生成C和c++代码®编码器™。金宝app