主要内容

音频贴标签机

定义并可视化基本事实标签

描述

音频贴标签机App允许您在区域级和文件级标记真实数据。

使用该应用程序,您可以:

  • 创建标签定义以实现一致性和快速标记。

  • 在回放过程中可视化时域波形。

  • 以交互方式在文件级和区域级指定标签。您可以通过直接在时域波形上绘图来指定区域。

  • 录制新音频以添加到数据集。

  • 应用自动标注检测到的语音区域。

  • 使用第三方语音到文本转录服务应用自动单词标记。看到“语音转录获取更多信息。

应用程序将数据导出为labeledSignalSet对象。你可以使用labeledSignalSet训练网络、分类器或分析数据并报告统计数据。

打开音频标签应用程序

  • MATLAB®工具条:在应用程序选项卡,在信号处理与通信,点击应用程序图标。

  • MATLAB命令提示符:输入audioLabeler

例子

全部展开

在本例中,您为音频信号创建了一个逻辑掩码,其中1对应于话语“yes”,0对应于话语“yes”的缺失。要创建掩码,可以通过音频贴标签机应用程序。

此示例要求您安装“语音转录功能。

听您想要标记的音频文件,然后在时域中将其可视化。

[audioIn,fs] = audioread(“KeywordSpeech-16-16-mono-34secs.flac”);sound(audioIn,fs) t = (0: number (audioIn)-1)/fs;情节(t, audioIn)包含(“时间(s)”) ylabel (“振幅”

打开音频贴标签机应用程序,并加载KeywordSpeech-16-16-mono-34secs.flac档案到数据浏览器

自动化,点击从语音到文本.在从语音到文本选项卡,选择您喜欢的语音转文本API。本例使用IBM语音到文本API。选择段话因此,文本标签被划分为单个的单词而不是句子。点击运行来与语音到文本API接口并创建一个新的感兴趣区域(ROI)标签。ROI标签包含由IBM的语音到文本API检测和标记的单词。

关闭从语音到文本选项卡,然后将标记的信号集导出到工作区。

这些标签被导出到工作区为labeledSignalSet具有时间戳的对象。设置变量labeledSet到时间戳labeledSignalSet对象。

labeledSet = myLabeledSet;

检查SpeechContent标签。

speechContent = labeledSet.Labels.SpeechContent{1}
speechContent =52×2表ROILimits值____________ _________ 0.87 1.31“first”“1.31 1.41”you“1.41 1.63”说“1.63 2.22”yes“2.25 2.52”然后“2.52 3.03”no“3.09 3.22”和“3.22 3.32”you“3.32 3.52”说“3.52 3.94”yes“3.94 4.16”然后“4.16 4.66”no“4.83 5.39”yes“5.42 5.57”“5.57 6.07”no“6.15 6.56”驾驶“\

语音到文本的API以秒为单位返回ROI标签的限制。使用SpeechContent表创建逻辑向量。

keywordLabels =演讲内容(演讲内容。值= =“是的”:);keyworddroilimitsinsamples = round(keywordLabels.ROILimits*fs);mask = 0 (size(audioIn),“逻辑”);i = 1:size(keywordROILimitsInSamples) mask(keywordROILimitsInSamples(i,1):keywordROILimitsInSamples(i,2)) = true;结束

绘制语音信号和关键字发现掩码。

情节(t, audioIn...t,面具)包含(“时间(s)”) ylabel (“振幅”)传说(“音频”“关键字识别掩码”“位置”“东南”

相关的例子

编程使用

全部展开

audioLabeler打开应用程序,使您能够标记关于音频的真实数据。

在R2018b中引入