VGGish预处理
库:
音频工具箱/深度学习
描述
的VGGish预处理阻止生成梅尔声音(音频输入,然后您可以养活VGGish pretrained网络或网络,接受VGGish一样的输入。
港口
输入
输出
参数
块特征
数据类型 |
|
直接引线 |
|
多维信号 |
|
适应信号 |
|
讨论二阶导数过零检测 |
|
算法
引用
[1]Gemmeke, Jort F。丹尼尔·p·w·埃利斯,迪伦弗里德曼,詹森,韦德劳伦斯,r·钱宁摩尔Manoj Plakal,马文·里特。“音频设置:本体和Human-Labeled音频事件的数据集。“在2017年IEEE国际会议音响、演讲和信号处理(ICASSP),776 - 80。新奥尔良,LA: IEEE 2017。https://doi.org/10.1109/ICASSP.2017.7952261。
[2]好时,肖恩,微酸的乔杜里,丹尼尔·p·w·埃利斯Jort f . Gemmeke Jansen, r·钱宁摩尔Manoj Plakal, et al。”CNN架构对大规模音频分类。“在2017年IEEE国际会议音响、演讲和信号处理(ICASSP)131 - 35。新奥尔良,LA: IEEE 2017。https://doi.org/10.1109/ICASSP.2017.7952132。
扩展功能
版本历史
介绍了R2022a