此示例显示如何在中标记口语单词信号贴标机。该示例使用IBM®Watson语音到文本API和音频工具箱™ 软件。请参阅语音文本转换(音频工具箱)有关以下方面的说明:
加载一个音频数据文件,其中包含一个男声所说的句子“橡树很强壮,也有阴影”。信号以44.1 kHz的频率采样。
[y,fs]=音频读取(“橡树,m4a”);%要收听,请键入soundsc(y,fs)
打开信号贴标机.在贴标机选项卡,单击进口选择从工作区
在成员列表。在对话框中,选择信号,Y
.
添加时间信息:选择时间
从下拉列表中选择并指定财政司司长
作为采样率,以kHz为单位测量。
关闭对话框。信号显示在标记信号集浏览器.
定义要附加到信号的标签。单击添加定义上贴标机选项卡。指定标签名称像话
,选择一个标签类型属于投资回报率
,然后输入数据类型像一串
.
创建一个自定义函数来标记音频文件中的单词stt
函数将在示例的后面显示。)请参阅自定义标签函数了解更多信息。
转到存储数据的目录演讲稿
P-code文件和存储IBM云凭据的JSON文件。
要创建函数,请在贴标机选项卡,单击自动化价值选择添加自定义函数.信号贴标机显示一个对话框,要求您输入要添加的函数的名称、说明和标签类型。输入stt
在名称字段并选择投资回报率
作为标签类型.你可以离开房间描述字段为空,或者您可以输入自己的描述。
复制功能代码并将其粘贴到显示的空模板中。保存文件。功能将显示在库中。
找到并识别输入信号中的单词。
在标记信号集浏览器,选中旁边的复选框Y
.
选择话
在标签定义浏览器
上自动价值画廊,选择stt
.
点击自动标签选择自动标记所有信号
点击好啊在显示的对话框中。
信号贴标机定位并标记所说的单词。
导出带标签的信号。在贴标机选项卡,单击出口选择标记信号设置为文件
。在出现的对话框中,输入名称抄本
添加到标记的信号集,并添加可选的简短描述。单击出口.
返回MATLAB®命令窗口。加载标记的信号集。该信号集只有一个成员。获取标签的名称,并使用该名称获取和显示转录的单词。
负载转录ln=getLabelNames(transcribedAudio);v=GetLabelValue(transcribedAudio,1,ln)
五=7×2表ROILimits值0.09 0.56“橡木”0.59 0.97“为1.78”强“1.94 2.19”,而“2.22 2.67”也“2.67 3.22”为“3.25 3.91”暗
将标签值从字符串更改为类别。使用信号屏蔽
对象为每个单词使用不同的颜色绘制信号。
v、 值=分类(v.Value,v.Value);msk=信号屏蔽(v,“采样器”,fs);s=getSignal(转录Daudio,1);plotsigroi(密歇根州立大学,s.y)
stt
功能:定位和识别口语单词此函数使用IBM Watson语音API和音频工具箱演讲稿
从音频文件中提取语音单词的扩展功能。
作用[labelVals,labelLocs]=stt(x,t,parentLabelVal,parentLabelLoc,varargin)aspechobject=speechClient(“IBM”,“时间戳”,true);fs=1/(t(2)-t(1));tixt=speech2text(aspechobectibm,x,fs);numLabels=numel(tixt.TimeStamps{:});labelVals=strings(numLabels,1);labelLocs=zeros(numLabels,2);对于idx=1:numLabels labelVals(idx)=tixt.时间戳{:}{idx}{1};labelLocs(idx,1)=tixt.时间戳{:}{idx}{2};labelLocs(idx,2)=tixt.时间戳{:}{idx}{3};终止终止