文档帮助中心文档
预训练说话人识别系统
sr=说话者认知
实例
sr=说话者认知返回预训练的说话人识别系统,“ivec-english-16kHz”.的“ivec-english-16kHz”系统是类型为的对象的实例驱动系统在LibriSpeech数据集上接受培训。
sr
“ivec-english-16kHz”
驱动系统
全部崩溃
本例使用预训练的说话人识别系统,“ivec-english-16kHz”.的“ivec-english-16kHz”的实例驱动系统在LibriSpeech数据集上接受培训。
将预训练的说话人识别系统下载到您的临时目录中,其位置由MATLAB®指定坦普迪尔命令如果要将数据文件放置在不同于的文件夹中坦普迪尔,修改目录名称。将临时目录添加到搜索路径。创建一个i向量系统。
坦普迪尔
fname=“ivec-english-16kHz.zip”; URL=['https://ssd.mathworks.com/金宝appsupportfiles/'...“音频/扬声器识别/”fname];zipFile=fullfile(tempdir,fname);websave(zipFile,URL);解压(zipFile,tempdir);addpath(tempdir)sr=speakerRecognition;
阅读两个语音信号,每个信号都包含用不同语调大声说出几次的短语“音量增大”。在其中一个信号中,说话者是男性。在另一个信号中,说话人是女性。
读取每个信号,把它分成两部分。其中一个部分是用来注册演讲者的。另一部分用于说话人的验证和识别。
(bf, fs) = audioread (“MaleVolumeUp-16-mono-6secs.ogg”); 登记bf=bf(1:3*fs);testBF=bf(3*fs+1:end);bfLabel=“BF”;(rd, fs) = audioread (“FemaleVolumeUp-16-mono-11secs.ogg”); 注册率=注册率(1:5*fs);testRD=rd(5*fs+1:end);rdLabel=“RD”;
将演讲者注册到演讲者识别系统中。这将创建可用于验证或识别的说话人模板。
注册(sr,{enrollBF,enrollRD},[bfLabel,rdLabel])
提取i向量…完成。注册i-vectors…完成。注册完成。
打电话给识别函数对测试数据的影响。
识别
候选者=识别(sr、testBF)
候选人=2×2表标签分数-1.0315 RD-178.77
候选者=识别(sr、testRD)
候选人=2×2表标签评分_____ _______ RD -99.188 BF -240.22
打电话给验证使用测试数据确认系统是否正确接受或拒绝扬声器。
验证
isVerified =验证(sr, testBF bfLabel)
已验证=必然的1.
isVerified=验证(sr、testBF、rdLabel)
已验证=必然的0
isVerified=验证(sr、testRD、rdLabel)
isVerified=验证(sr、testRD、bfLabel)
打电话给信息函数获取有关如何训练模型的信息。
信息
信息(sr)
Header -本系统使用LibriSpeech训练和开发集进行训练。LibriSpeech是一个以16khz采样的大约1000小时的阅读英语语音语料库。-检测误差权衡是通过从LibriSpeech测试集中的每个发言者登记一个文件,然后评估登记和剩余数据的详尽对。输入数据类型:double trainExtractor Train signals: 286808 UBMNumComponents: 2048 UBMNumIterations: 10 TVSRank: 512 TVSNumIterations: 5 trainClassifier Train signals: 286807 Train labels: 1(91), 100043(31)…和5652更多NumEigenvectors: 200 PLDANumDimensions: 200 PLDANumIterations: 5 detectionErrorTradeoff评估信号:5382评估标签:102255(46),1066(24)…和175多
从搜索路径中删除临时目录。
rmpath(tempdir)
预先训练的说话人识别系统,返回为类型对象驱动系统.
[1] Panayotov、Vassil、陈国国、Daniel Povey和Sanjeev Khudanpur。“Librispeech:基于公共领域有声图书的ASR语料库”,摘自2015年IEEE声学、语音和信号处理国际会议(ICASSP), 5206 - 10。南布里斯班,昆士兰,澳大利亚:IEEE, 2015。https://doi.org/10.1109/ICASSP.2015.7178964.
分类声音|驱动系统|皮克恩
分类声音
皮克恩
您拥有此示例的修改版本。是否要用编辑打开此示例?
您单击了与此MATLAB命令对应的链接:
通过在MATLAB命令窗口中输入命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站以获取翻译后的内容(如果可用),并查看本地活动和优惠。根据您的位置,我们建议您选择:.
您还可以从以下列表中选择网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区网站未针对您所在地的访问进行优化。
联系当地办事处
现在受审