使用语音识别命令帮助

1视图(30天)
Barb
Barb 2020年1月22日
如果我试着写:
h =图(“单位”,“归一化”,“位置”(0.2 - 0.1 0.6 - 0.8));
filterBank = designAuditoryFilterBank (fs,“FrequencyScale”,“树皮”,
“FFTLength”,1024,
“NumBands”numBands,
“FrequencyRange”[7000]);
ishandle (h)
%从音频设备中提取音频样本和样本添加到
%的缓冲。
x = audioIn ();
waveBuffer (1: end-numel (x) = waveBuffer(元素个数(x) + 1:结束);
waveBuffer (end-numel (x) + 1:结束)= x;
%计算最新的音频样本的光谱图。
[~,~,~,规范]=光谱图(waveBuffer损害(frameLength,“周期”512年),frameLength - hopLength,“单向的”);
规范= filterBank *规范;
规范= log10(规范+ epsil);
%分类当前光谱图,保存标签的标签缓冲区,
%并保存预测概率的概率缓冲区。
[YPredicted,聚合氯化铝]=分类(trainedNet,规范,“ExecutionEnvironment”,“cpu”);
YBuffer (1: end-1) = YBuffer(2:结束);
YBuffer(结束)= YPredicted;
probBuffer (: 1: end-1) = probBuffer(:, 2:结束);
probBuffer(:,结束)=聚合氯化铝';
%绘制当前波形和声谱图。
次要情节(2,1,1);
情节(waveBuffer)
ylim ([-0.2, 0.2])
次要情节(2,1,2)
pcolor(规范)
caxis ([specMin + 2 specMax])
阴影
%现在实际的命令执行一个非常简单的检测
%的阈值操作。声明一个检测和显示它
%图标题如果以下:
% 1)最常见的标签不是| |背景。
% 2)至少| countThreshold |最新帧标签的同意。
% 3)最大的预测概率预测的标签
%至少| probThreshold |。否则,不声明一个检测。
[YMode,计数]=模式(YBuffer);
countThreshold =装天花板(classificationRate * 0.2);
maxProb = max (probBuffer(标签= = YMode:));
probThreshold = 0.7;
次要情节(2,1,1);
如果YMode = =“背景”| |数< countThreshold | | maxProb < probThreshold
标题(”“)
其他的
标题(string (YMode),“字形大小”,20)
结束
drawnow
结束
它给了我错误:
在designAuditoryFilterBank >(第104行)
错误使用DAGNetwork / calculatePredict > predictBatch(第151行)
不正确的输入的大小。输入图像必须有一个大小(100 198)。
错误在DAGNetwork / calculatePredict(第17行)
Y = predictBatch (…
错误DAGNetwork /分类(第134行)
成绩=。calculatePredict (…
错误SeriesNetwork /分类(第502行)
(标签、分数)= this.UnderlyingDAGNetwork.classify (X,
变长度输入宗量{:});
训练后我没有改变任何东西,所以我不知道如何解决它。

答案(0)

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!