检测语音和其他声音,并确定它们的开始和结束时间。对于流媒体应用程序,使用语音活动检测器(VAD)输出语音在给定帧中出现的概率。你也可以用“语音转录为语音信号创建时间对齐的单词标签。
音频贴标签机 | 定义和可视化地面真相标签 |
voiceActivityDetector |
检测音频信号中语音的存在 |
detectSpeech |
检测语音信号中的语音边界 |
classifySound |
对音频信号中的声音进行分类 |
声音活动检测器 | 检测音频信号中语音的存在 |