音频贴标签机

定义并可视化基本事实标签

展开全部页面

描述

的音频贴标签机App允许您在区域级和文件级标记真实数据。

使用该应用程序，您可以:

创建标签定义以实现一致性和快速标记。
在回放过程中可视化时域波形。
以交互方式在文件级和区域级指定标签。您可以通过直接在时域波形上绘图来指定区域。
录制新音频以添加到数据集。
应用自动标注检测到的语音区域。
使用第三方语音到文本转录服务应用自动单词标记。看到“语音转录获取更多信息。

应用程序将数据导出为labeledSignalSet对象。你可以使用labeledSignalSet训练网络、分类器或分析数据并报告统计数据。

打开音频标签应用程序

MATLAB^®工具条:在应用程序选项卡,在信号处理与通信，点击应用程序图标。
MATLAB命令提示符:输入audioLabeler．

例子

全部展开

使用音频标签器创建关键字发现掩码

打开实时脚本

在本例中，您为音频信号创建了一个逻辑掩码，其中1对应于话语“yes”，0对应于话语“yes”的缺失。要创建掩码，可以通过音频贴标签机应用程序。

此示例要求您安装“语音转录功能。

听您想要标记的音频文件，然后在时域中将其可视化。

[audioIn,fs] = audioread(“KeywordSpeech-16-16-mono-34secs.flac”）;sound(audioIn,fs) t = (0: number (audioIn)-1)/fs;情节(t, audioIn)包含(“时间(s)”) ylabel (“振幅”）

打开音频贴标签机应用程序，并加载KeywordSpeech-16-16-mono-34secs.flac档案到数据浏览器．

下自动化,点击从语音到文本．在从语音到文本选项卡，选择您喜欢的语音转文本API。本例使用IBM语音到文本API。选择段话因此，文本标签被划分为单个的单词而不是句子。点击运行来与语音到文本API接口并创建一个新的感兴趣区域(ROI)标签。ROI标签包含由IBM的语音到文本API检测和标记的单词。

关闭从语音到文本选项卡，然后将标记的信号集导出到工作区。

这些标签被导出到工作区为labeledSignalSet具有时间戳的对象。设置变量labeledSet到时间戳labeledSignalSet对象。

labeledSet = myLabeledSet;

检查SpeechContent标签。

speechContent = labeledSet.Labels.SpeechContent{1}

speechContent =52×2表ROILimits值____________ _________ 0.87 1.31“first”“1.31 1.41”you“1.41 1.63”说“1.63 2.22”yes“2.25 2.52”然后“2.52 3.03”no“3.09 3.22”和“3.22 3.32”you“3.32 3.52”说“3.52 3.94”yes“3.94 4.16”然后“4.16 4.66”no“4.83 5.39”yes“5.42 5.57”“5.57 6.07”no“6.15 6.56”驾驶“\

语音到文本的API以秒为单位返回ROI标签的限制。使用SpeechContent表创建逻辑向量。

keywordLabels =演讲内容(演讲内容。值= =“是的”:);keyworddroilimitsinsamples = round(keywordLabels.ROILimits*fs);mask = 0 (size(audioIn)，“逻辑”）;为i = 1:size(keywordROILimitsInSamples) mask(keywordROILimitsInSamples(i,1):keywordROILimitsInSamples(i,2)) = true;结束

绘制语音信号和关键字发现掩码。

情节(t, audioIn.．.t,面具)包含(“时间(s)”) ylabel (“振幅”)传说(“音频”，“关键字识别掩码”，“位置”，“东南”）

编程使用

全部展开

`audioLabeler`

audioLabeler打开应用程序，使您能够标记关于音频的真实数据。

另请参阅

signalLabelDefinition|labeledSignalSet|audioDatastore|audioDeviceReader|audioDeviceWriter

在R2018b中引入

音频工具箱文档

金宝app

试试MATLAB、Sim金宝appulink和其他产品下载188bet金宝搏

现在就去审判吧