主要内容

Simulink中的语音命令识别金宝app

此示例显示了一个模型,该模型检测到音频中语金宝app音命令的存在。该模型使用验证的卷积神经网络来识别一组给定的命令。

语音命令识别模型

该模型识别以下语音命令:

  • “是的”

  • “不”

  • “向上”

  • “向下”

  • “剩下”

  • “对”

  • “在”

  • “离开”

  • "stop"

  • “去”

该模型使用验证的卷积深度学习网络。参考示例使用深度学习的语音命令识别有关该网络架构以及如何训练它的详细信息。

打开模型。

模型=“言语概述”;Open_System(型号)

该模型将音频流分为一秒钟的重叠段。从每个段计算MEL频谱图。频谱图被馈送到验证的网络中。

使用手动开关从麦克风中选择实时流或存储在音频文件中的命令。对于文件上的命令,请使用旋转开关选择三个命令之一(GO,是并停止)。

听觉光谱图提取

深度学习网络经过使用AudioFeatureExtractor计算的听觉谱图培训。为了使模型正确对命令进行分类,必须以与火车界相同的方式提取听觉谱图。

定义特征提取的参数。框架每一帧的时间谱它吗tion.跳舞是每个频谱之间的时间步长。数字是听觉光谱图中的过滤器数。

fs = 16000; frameDuration = 0.025; frameSamples = round(frameDuration*fs); hopDuration = 0.010; hopSamples = round(hopDuration*fs); numBands = 50;

定义AudioFeatureExtractor对象以执行功能提取。该对象与使用的对象相同使用深度学习的语音命令识别提取训练光谱图。

afe = AudioFeatUreExtractor(...'采样率',fs,...“ fftlength”,512,...'窗户',汉恩(框架样本,“周期性”),...“重叠式”,,,,frameSamples - hopSamples,...'Barkspectrum',,,,true); setExtractorParams(afe,'Barkspectrum',,,,'NumBands',numbands,“风向规定”,,,,false);

调用GenerateMatLabFunction创建功能提取功能。此功能是从听觉光谱图模型中的MATLAB功能块。这样可以确保模型中使用的特征提取与训练中使用的功能匹配。

generatematlabfunction(afe,“ extractspeechfeatures”

运行模型

模拟该模型20秒。要无限期运行模型,请将停止时间设置为INF。

set_param(型号,“停止时间”,,,,'20');sim(model);

公认的命令在显示屏中打印出来。语音谱图显示在频谱分析仪范围中。网络激活在时间范围内显示了对不同支持的命令的信心。金宝app

关闭模型。

close_system(model,0)