此示例显示了一个Simulink模型,可检金宝app测音频中的语音命令的存在。该模型使用普拉雷覆盖的卷积神经网络来识别给定的一组命令。
该模型识别以下语音命令:
“是的”
“不”
“向上”
“下”
“剩下”
“对”
“在”
“离开”
“停止”
“走”
该模型使用普里雷普雷雷卷积的深度学习网络。参考这个例子使用深度学习的言语命令识别有关该网络架构的详细信息以及您如何训练它。
打开模型。
模型='Speathcommandrecognition';Open_System(型号)
该模型将音频流打破到一秒重叠段中。从每个段计算MEL谱图。频谱图被馈送到佩带的网络。
使用手动切换从麦克风或存储在音频文件中的读取命令中选择直播流。对于文件上的命令,请使用旋转开关选择三个命令之一(Go,是和停止)。
深度学习网络在使用Audiofeatureextractor计算的听觉频谱图上培训。对于模型正确对命令进行分类,必须以与训练阶段相同的方式提取听觉频谱图。
定义特征提取的参数。框架
为进行频谱计算的每帧的持续时间。哈姆瑟
是每个频谱之间的时间步长。numbands.
是听觉频谱图中的过滤器数量。
fs = 16000;frameDuration = 0.025;frameSamples =圆(frameDuration * fs);hopDuration = 0.010;hopSamples =圆(hopDuration * fs);numBands = 50;
定义AudioFeatureextractor对象以执行功能提取。该对象与使用的对象相同使用深度学习的言语命令识别提取培训谱图。
AFE = audiofeatureextractor(......'采样率',fs,......'fftlength'512,......'窗户',汉恩(框架,'定期'),......'overlaplencth'frameSamples - hopSamples......'Barkspectrum',真正的);setExtractorParams (afe'Barkspectrum'那“NumBands”,numband,'风向正常化'、假);
调用generatematlabfunct以创建功能提取功能。此功能从中调用听觉频谱图
MATLAB功能块在模型中。这可确保模型中使用的特征提取与培训中使用的特征提取匹配。
generatematlabfunction(afe,'提取寿服司法)
模拟模型20秒。要无限期地运行模型,请将停止时间设置为INF。
set_param(型号,'停止'那'20');sim(模型);
识别的命令在显示块中打印。语音谱图显示在频谱分析仪范围内。在时间范围内显示给出不同支持的命令的置信水平的网络激活。金宝app
关闭模型。
close_system(模型中,0)