yamnet分类的预处理音频
音频工具箱/深度学习
这YAMNet预处理块从音频输入生成MEL谱图,该音频输入可以馈送到亚马特掠夺网络或接受与Yamnet相同输入的网络。
数据类型 |
|
直接引线 |
|
多维信号 |
|
可变尺寸信号 |
|
零交叉检测 |
|
Gemmeke, Jort F., Daniel P. W. Ellis, Dylan Freedman, Aren Jansen, Wade Lawrence, R. Channing Moore, Manoj Plakal和Marvin Ritter。音频集:用于音频事件的本体和人类标记的数据集。2017 IEEE声学、语音和信号处理国际会议(ICASSP),IEEE,2017,第776-80页。doi.org(crossref),DOI:10.1109 / ICASSP.2017.7952261。
[2] Hershey,Shawn,Sourish Chaudhuri,Daniel P. W. Ellis,Jort F. Gemmeke,Aren Jansen,R. Channing Moore,Manoj Plakal等。“CNN架构用于大规模音频分类。”2017 IEEE声学、语音和信号处理国际会议(ICASSP), IEEE, 2017,第131-35页。doi.org(crossref),DOI:10.1109 / ICASSP.2017.7952132。