主要内容

言语认知

预训练说话人识别系统

描述

实例

sr=说话者认知返回预训练的说话人识别系统,“ivec-english-16kHz”.的“ivec-english-16kHz”系统是类型为的对象的实例驱动系统在LibriSpeech数据集上接受培训。

例子

全部崩溃

本例使用预训练的说话人识别系统,“ivec-english-16kHz”.的“ivec-english-16kHz”的实例驱动系统在LibriSpeech数据集上接受培训。

将预训练的说话人识别系统下载到您的临时目录中,其位置由MATLAB®指定坦普迪尔命令如果要将数据文件放置在不同于的文件夹中坦普迪尔,修改目录名称。将临时目录添加到搜索路径。创建一个i向量系统。

fname=“ivec-english-16kHz.zip”; URL=['https://ssd.mathworks.com/金宝appsupportfiles/'...“音频/扬声器识别/”fname];zipFile=fullfile(tempdir,fname);websave(zipFile,URL);解压(zipFile,tempdir);addpath(tempdir)sr=speakerRecognition;

阅读两个语音信号,每个信号都包含用不同语调大声说出几次的短语“音量增大”。在其中一个信号中,说话者是男性。在另一个信号中,说话人是女性。

读取每个信号,把它分成两部分。其中一个部分是用来注册演讲者的。另一部分用于说话人的验证和识别。

(bf, fs) = audioread (“MaleVolumeUp-16-mono-6secs.ogg”); 登记bf=bf(1:3*fs);testBF=bf(3*fs+1:end);bfLabel=“BF”;(rd, fs) = audioread (“FemaleVolumeUp-16-mono-11secs.ogg”); 注册率=注册率(1:5*fs);testRD=rd(5*fs+1:end);rdLabel=“RD”

将演讲者注册到演讲者识别系统中。这将创建可用于验证或识别的说话人模板。

注册(sr,{enrollBF,enrollRD},[bfLabel,rdLabel])
提取i向量…完成。注册i-vectors…完成。注册完成。

打电话给识别函数对测试数据的影响。

候选者=识别(sr、testBF)
候选人=2×2表标签分数-1.0315 RD-178.77
候选者=识别(sr、testRD)
候选人=2×2表标签评分_____ _______ RD -99.188 BF -240.22

打电话给验证使用测试数据确认系统是否正确接受或拒绝扬声器。

isVerified =验证(sr, testBF bfLabel)
已验证=必然的1.
isVerified=验证(sr、testBF、rdLabel)
已验证=必然的0
isVerified=验证(sr、testRD、rdLabel)
已验证=必然的1.
isVerified=验证(sr、testRD、bfLabel)
已验证=必然的0

打电话给信息函数获取有关如何训练模型的信息。

信息(sr)
Header -本系统使用LibriSpeech训练和开发集进行训练。LibriSpeech是一个以16khz采样的大约1000小时的阅读英语语音语料库。-检测误差权衡是通过从LibriSpeech测试集中的每个发言者登记一个文件,然后评估登记和剩余数据的详尽对。输入数据类型:double trainExtractor Train signals: 286808 UBMNumComponents: 2048 UBMNumIterations: 10 TVSRank: 512 TVSNumIterations: 5 trainClassifier Train signals: 286807 Train labels: 1(91), 100043(31)…和5652更多NumEigenvectors: 200 PLDANumDimensions: 200 PLDANumIterations: 5 detectionErrorTradeoff评估信号:5382评估标签:102255(46),1066(24)…和175多

从搜索路径中删除临时目录。

rmpath(tempdir)

输出参数

全部崩溃

预先训练的说话人识别系统,返回为类型对象驱动系统

参考文献

[1] Panayotov、Vassil、陈国国、Daniel Povey和Sanjeev Khudanpur。“Librispeech:基于公共领域有声图书的ASR语料库”,摘自2015年IEEE声学、语音和信号处理国际会议(ICASSP), 5206 - 10。南布里斯班,昆士兰,澳大利亚:IEEE, 2015。https://doi.org/10.1109/ICASSP.2015.7178964

在R2021b中引入