使用语音识别命令帮助

1视图(30天)

显示旧的评论

Barb 2020年1月22日

0
链接

这个问题直接联系

//www.tatmou.com/matlabcentral/answers/501473-help-with-speech-recognition-command

一切都在我的工作的例子 //www.tatmou.com/help/deeplearning/examples/deep-learning-speech-recognition.html

如果我试着写:

                         h =图(“单位”,“归一化”,“位置”(0.2 - 0.1 0.6 - 0.8));
                        
                         filterBank = designAuditoryFilterBank (fs,“FrequencyScale”,“树皮”,…
                        
                         “FFTLength”,1024,…
                        
                         “NumBands”numBands,…
                        
                         “FrequencyRange”[7000]);
                        
                         而ishandle (h)
                        
                         %从音频设备中提取音频样本和样本添加到
                        
                         %的缓冲。
                        
                         x = audioIn ();
                        
                         waveBuffer (1: end-numel (x) = waveBuffer(元素个数(x) + 1:结束);
                        
                         waveBuffer (end-numel (x) + 1:结束)= x;
                        
                         %计算最新的音频样本的光谱图。
                        
                         [~,~,~,规范]=光谱图(waveBuffer损害(frameLength,“周期”512年),frameLength - hopLength,“单向的”);
                        
                         规范= filterBank *规范;
                        
                         规范= log10(规范+ epsil);
                        
                         %分类当前光谱图,保存标签的标签缓冲区,
                        
                         %并保存预测概率的概率缓冲区。
                        
                         [YPredicted,聚合氯化铝]=分类(trainedNet,规范,“ExecutionEnvironment”,“cpu”);
                        
                         YBuffer (1: end-1) = YBuffer(2:结束);
                        
                         YBuffer(结束)= YPredicted;
                        
                         probBuffer (: 1: end-1) = probBuffer(:, 2:结束);
                        
                         probBuffer(:,结束)=聚合氯化铝';
                        
                         %绘制当前波形和声谱图。
                        
                         次要情节(2,1,1);
                        
                         情节(waveBuffer)
                        
                         轴紧
                        
                         ylim ([-0.2, 0.2])
                        
                         次要情节(2,1,2)
                        
                         pcolor(规范)
                        
                         caxis ([specMin + 2 specMax])
                        
                         阴影平
                        
                         %现在实际的命令执行一个非常简单的检测
                        
                         %的阈值操作。声明一个检测和显示它
                        
                         %图标题如果以下:
                        
                         % 1)最常见的标签不是| |背景。
                        
                         % 2)至少| countThreshold |最新帧标签的同意。
                        
                         % 3)最大的预测概率预测的标签
                        
                         %至少| probThreshold |。否则,不声明一个检测。
                        
                         [YMode,计数]=模式(YBuffer);
                        
                         countThreshold =装天花板(classificationRate * 0.2);
                        
                         maxProb = max (probBuffer(标签= = YMode:));
                        
                         probThreshold = 0.7;
                        
                         次要情节(2,1,1);
                        
                         如果YMode = =“背景”| |数< countThreshold | | maxProb < probThreshold
                        
                         标题(”“)
                        
                         其他的
                        
                         标题(string (YMode),“字形大小”,20)
                        
                         结束
                        
                         drawnow
                        
                         结束