主要内容

Simulink中的语音指令识别金宝app

此示例显示了一个Simulink®模型,该金宝app模型检测音频中语音命令的存在。该模型使用预训练的卷积神经网络来识别给定的一组命令。

语音指令识别模型

该模型识别这些语音命令:

  • “是的”

  • “不”

  • 《飞屋环游记》

  • “向下”

  • “左”

  • “正确”

  • “上”

  • “关闭”

  • “停止”

  • “走”

该模型使用预训练的卷积深度学习网络。参考示例利用深度学习训练语音指令识别模型(音频工具箱)关于这个网络的架构以及如何训练它的详细信息。

打开模型。

模型=“speechCommandRecognition”;open_system(模型)

该模型将音频流分解为一秒重叠的片段。树皮谱图由每一段计算。谱图被馈送到预训练的网络。

使用手动开关选择来自麦克风的实时流或读取存储在音频文件中的命令。对于文件中的命令,使用旋转开关选择三个命令之一(Go、Yes或Stop)。

听觉谱图提取

深度学习网络在听觉频谱图上进行训练audioFeatureExtractor(音频工具箱).模型中的听觉谱图块已被配置为提取与网络训练时相同的特征。

运行模型

模拟模型20秒。

set_param(模型、StopTime =“20”);sim(模型);

识别的命令打印在显示块中。网络激活在一个时间范围内显示,它给出了不同受支持命令的置信级别。金宝app

关闭模型。

close_system(模型中,0)