VGGish
库:
音频工具箱/深度学习
描述
VGGish块利用一个pretrained卷积神经网络训练的AudioSet数据集从音频信号中提取特征嵌入。
港口
输入
输出
参数
块特征
数据类型 |
|
直接引线 |
|
多维信号 |
|
适应信号 |
|
讨论二阶导数过零检测 |
|
引用
[1]Gemmeke, Jort F。丹尼尔·p·w·埃利斯,迪伦弗里德曼,詹森,韦德劳伦斯,r·钱宁摩尔Manoj Plakal,马文·里特。“音频设置:本体和Human-Labeled音频事件的数据集。“在2017年IEEE国际会议音响、演讲和信号处理(ICASSP),776 - 80。新奥尔良,LA: IEEE 2017。https://doi.org/10.1109/ICASSP.2017.7952261。
[2]好时,肖恩,微酸的乔杜里,丹尼尔·p·w·埃利斯Jort f . Gemmeke Jansen, r·钱宁摩尔Manoj Plakal, et al。”CNN架构对大规模音频分类。“在2017年IEEE国际会议音响、演讲和信号处理(ICASSP)131 - 35。新奥尔良,LA: IEEE 2017。https://doi.org/10.1109/ICASSP.2017.7952132。
扩展功能
版本历史
介绍了R2022a