主要内容gydF4y2Ba

预测gydF4y2Ba

使用多款纠错输出代码(ECOC)模型进行分类观察gydF4y2Ba

描述gydF4y2Ba

例子gydF4y2Ba

标签gydF4y2Ba=预测(gydF4y2BaMdlgydF4y2Ba,gydF4y2BaXgydF4y2Ba)gydF4y2Ba返回预测类标签的向量(gydF4y2Ba标签gydF4y2Ba)用于表或矩阵中的预测数据gydF4y2BaXgydF4y2Ba,基于训练的多类纠错输出码(ECOC)模型gydF4y2BaMdlgydF4y2Ba.经过训练的ECOC模型可以是完整的,也可以是紧凑的。gydF4y2Ba

例子gydF4y2Ba

标签gydF4y2Ba=预测(gydF4y2BaMdlgydF4y2Ba,gydF4y2BaXgydF4y2Ba,gydF4y2Ba名称,值gydF4y2Ba)gydF4y2Ba使用由一个或多个名称-值对参数指定的附加选项。例如,可以指定后验概率估计方法、译码方案和冗余级别。gydF4y2Ba

例子gydF4y2Ba

[gydF4y2Ba标签gydF4y2Ba,gydF4y2BaNegLossgydF4y2Ba,gydF4y2BaPBScoregydF4y2Ba] =预测(gydF4y2Ba___gydF4y2Ba)gydF4y2Ba使用前面语法中的任何输入参数组合,并额外返回:gydF4y2Ba

  • 一系列否定的平均水平gydF4y2Ba二进制损失gydF4y2Ba(gydF4y2BaNegLossgydF4y2Ba).对于每一个gydF4y2BaXgydF4y2Ba,gydF4y2Ba预测gydF4y2Ba指定产生最大负平均二进制损失(或,等价地,最小平均二进制损失)的类的标签。gydF4y2Ba

  • 一组积极等级的分数(gydF4y2BaPBScoregydF4y2Ba)对于每个二进制学习者分类的观察。gydF4y2Ba

例子gydF4y2Ba

[gydF4y2Ba标签gydF4y2Ba,gydF4y2BaNegLossgydF4y2Ba,gydF4y2BaPBScoregydF4y2Ba,gydF4y2Ba后gydF4y2Ba] =预测(gydF4y2Ba___gydF4y2Ba)gydF4y2Ba另外,返回观测值的后验类别概率估计值(gydF4y2Ba后gydF4y2Ba).gydF4y2Ba

要获得后验类别概率,必须设置gydF4y2Ba'fitposterior',真实gydF4y2Ba在培训ECOC模式时使用gydF4y2Bafitcecoc.gydF4y2Ba.除此以外,gydF4y2Ba预测gydF4y2Ba抛出错误。gydF4y2Ba

例子gydF4y2Ba

全部折叠gydF4y2Ba

载入费雪的虹膜数据集。指定预测器数据gydF4y2BaXgydF4y2Ba,响应数据gydF4y2BaYgydF4y2Ba,和班级的顺序gydF4y2BaYgydF4y2Ba.gydF4y2Ba

负载gydF4y2BafisheririsgydF4y2BaX =量;Y =分类(物种);classOrder =独特(Y);rng (1);gydF4y2Ba%的再现性gydF4y2Ba

使用支持向量机二分类器训练ECOC模型。指定30%的拒绝样本,使用SVM模板标准化预测器,并指定类顺序。gydF4y2Ba

t = templatesvm(gydF4y2Ba'标准化'gydF4y2Ba,真正的);PMdl = fitcecoc (X, Y,gydF4y2Ba“坚持”gydF4y2Ba,0.30,gydF4y2Ba“学习者”gydF4y2Ba,t,gydF4y2Ba'classnames'gydF4y2Ba,classorder);mdl = pmdl.tromed {1};gydF4y2Ba%提取训练过的紧凑分类器gydF4y2Ba

PMDL.gydF4y2Ba是一个gydF4y2BaClassificationedecoc.gydF4y2Ba模型。它有物业gydF4y2Ba训练有素的gydF4y2Ba,一个1 × 1单元数组,其中包含gydF4y2BaCompactClassificationECOCgydF4y2Ba使用培训集培训的软件的模型。gydF4y2Ba

预测样品标签。打印真实标签和预测标签的随机子集。gydF4y2Ba

testInds =测试(PMdl.Partition);gydF4y2Ba%提取测试指标gydF4y2BaXTest = X (testInds:);欧美= Y (testInds:);标签=预测(Mdl XTest);idx = randsample (sum (testInds), 10);表(欧美(idx),标签(idx),gydF4y2Ba......gydF4y2Ba'variablenames'gydF4y2Ba, {gydF4y2Ba'truelabels'gydF4y2Ba,gydF4y2Ba“PredictedLabels”gydF4y2Ba})gydF4y2Ba
ans =.gydF4y2Ba10×2表gydF4y2Ba真实标签预测标签__________ _______________ setosa setosa versicolor vericolor vericolor setosa setosa setosa setosa setosagydF4y2Ba

MdlgydF4y2Ba正确地标记所有与指数的测试样本观测之外gydF4y2BaidxgydF4y2Ba.gydF4y2Ba

载入费雪的虹膜数据集。指定预测器数据gydF4y2BaXgydF4y2Ba,响应数据gydF4y2BaYgydF4y2Ba,和班级的顺序gydF4y2BaYgydF4y2Ba.gydF4y2Ba

负载gydF4y2BafisheririsgydF4y2BaX =量;Y =分类(物种);classOrder =独特(Y);gydF4y2Ba%课堂秩序gydF4y2Barng (1);gydF4y2Ba%的再现性gydF4y2Ba

使用支持向量机二分类器训练ECOC模型,并指定30%的坚持样本。使用SVM模板标准化预测器,并指定类的顺序。gydF4y2Ba

t = templatesvm(gydF4y2Ba'标准化'gydF4y2Ba,真正的);PMdl = fitcecoc (X, Y,gydF4y2Ba“坚持”gydF4y2Ba,0.30,gydF4y2Ba“学习者”gydF4y2Ba,t,gydF4y2Ba'classnames'gydF4y2Ba,classorder);mdl = pmdl.tromed {1};gydF4y2Ba%提取训练过的紧凑分类器gydF4y2Ba

PMDL.gydF4y2Ba是一个gydF4y2BaClassificationedecoc.gydF4y2Ba模型。它有物业gydF4y2Ba训练有素的gydF4y2Ba,一个1 × 1单元数组,其中包含gydF4y2BaCompactClassificationECOCgydF4y2Ba使用培训集培训的软件的模型。gydF4y2Ba

支持向量机的分数被标记为从观测到决策边界的距离。因此,gydF4y2Ba (gydF4y2Ba -gydF4y2Ba ∞gydF4y2Ba ,gydF4y2Ba ∞gydF4y2Ba )gydF4y2Ba 是域名。创建一个定制二进制丢失函数,执行以下操作:gydF4y2Ba

  • 绘制编码设计矩阵(gydF4y2Ba米gydF4y2Ba)和正向分类得分(gydF4y2Ba年代gydF4y2Ba)来计算每次观察的二进制损失。gydF4y2Ba

  • 使用线性的损失。gydF4y2Ba

  • 使用中值合计二进制学习器损失。gydF4y2Ba

您可以为二进制损耗函数创建一个单独的函数,然后将其保存在MATLAB®路径上。或者,您可以指定一个匿名二进制丢失函数。在本例中,创建一个函数句柄(gydF4y2BaCustomBl.gydF4y2Ba)匿名二进制损失函数。gydF4y2Ba

customBL = @(M,s) median(1 - bsxfun(@times,M,s),2,gydF4y2Ba'omitnan'gydF4y2Ba/ 2;gydF4y2Ba

预测测试样本标签并估计每个类的中位数二进制损失。为随机的10个测试样本观察结果打印每个类的负二进制损失的中位数。gydF4y2Ba

testInds =测试(PMdl.Partition);gydF4y2Ba%提取测试指标gydF4y2BaXTest = X (testInds:);欧美= Y (testInds:);[标签,dropsа] =预测(MDL,XTEST,gydF4y2Ba'二元乐'gydF4y2Ba,海关);idx = randsample (sum (testInds), 10);ClassOrder.gydF4y2Ba
classOrder =gydF4y2Ba3 x1分类gydF4y2BaSetosa Versicolor Virginica.gydF4y2Ba
表(ytest(idx),标签(idx),dropsа(idx,:),gydF4y2Ba'variablenames'gydF4y2Ba,gydF4y2Ba......gydF4y2Ba{gydF4y2Ba'truilabel'gydF4y2Ba,gydF4y2Ba'predightlabel'gydF4y2Ba,gydF4y2Ba'opoloss'gydF4y2Ba})gydF4y2Ba
ans =.gydF4y2Ba10×3表gydF4y2BaTrueLabel PredictedLabel NegLoss __________ ______________ __________________________________ setosa云芝0.18569 1.989 -3.6747云芝弗吉尼亚-1.3316 -0.12346 -0.044933 setosa云芝0.13897 1.9274 -3.5664弗吉尼亚弗吉尼亚-1.5133 -0.38288 0.39616花斑癣菌-0.87209 0.74813 -1.376 setosa云芝0.4838 1.9987 -3.9825弗吉尼亚弗吉尼亚-1.9363-0.67586 1.1122 Virginica Virginica -1.5789 -0.8337 0.91265 Setosa Versicolor 0.50999 2.1223 -4.1323 Setosa Versicolor 0.36117 2.0608 -3.922gydF4y2Ba

列的顺序对应于的元素gydF4y2BaClassOrder.gydF4y2Ba.该软件根据最大否定损耗预测标签。结果表明,线性损耗的中位数可能无法表现和其他损失。gydF4y2Ba

使用支持向量机二进制学习器训练ECOC分类器。首先预测训练样本标签和类的后验概率。然后预测网格中每个点的最大类别后验概率。可视化结果。gydF4y2Ba

载入费雪的虹膜数据集。将花瓣尺寸指定为预测器和物种名称作为响应。gydF4y2Ba

负载gydF4y2BafisheririsgydF4y2BaX =量(:,3:4);Y =物种;rng (1);gydF4y2Ba%的再现性gydF4y2Ba

创建SVM模板。标准化预测器,并指定高斯内核。gydF4y2Ba

t = templatesvm(gydF4y2Ba'标准化'gydF4y2Ba,真的,gydF4y2Ba'骨箱'gydF4y2Ba,gydF4y2Ba“高斯”gydF4y2Ba);gydF4y2Ba

tgydF4y2Ba是一个支持向量机模板。它的大部分属性都是空的。当软件训练ECOC分类器时,它将适用的属性设置为它们的默认值。gydF4y2Ba

使用支持向量机模板训练ECOC分类器。将分类分数转换为分类后验概率(由gydF4y2Ba预测gydF4y2Ba或gydF4y2BaresubPredictgydF4y2Ba)使用gydF4y2Ba“FitPosterior”gydF4y2Ba名称-值对的论点。属性指定类的顺序gydF4y2Ba'classnames'gydF4y2Ba名称-值对的论点。方法在训练期间显示诊断消息gydF4y2Ba“详细”gydF4y2Ba名称-值对的论点。gydF4y2Ba

Mdl = fitcecoc (X, Y,gydF4y2Ba“学习者”gydF4y2Ba,t,gydF4y2Ba“FitPosterior”gydF4y2Ba,真的,gydF4y2Ba......gydF4y2Ba'classnames'gydF4y2Ba, {gydF4y2Ba'setosa'gydF4y2Ba,gydF4y2Ba'versicolor'gydF4y2Ba,gydF4y2Ba“virginica”gydF4y2Ba},gydF4y2Ba......gydF4y2Ba“详细”gydF4y2Ba2);gydF4y2Ba
培训二进制学习者1(SVM),其中3个,50个负和50个阳性观察。负类指数:2个正类指数:1用于学习者1(SVM)的后验概率。培训二元学习者2(SVM),其中3个,50个负和50个阳性观察。负类指数:3个正类指数:1拟合学习者2(SVM)的后验概率。培训二进制学习者3(SVM),其中50个负和50个阳性观察。负类指数:3个正类指数:2学习者3(SVM)的拟合后验概率。gydF4y2Ba

MdlgydF4y2Ba是一个gydF4y2BaClassificationECOCgydF4y2Ba模型。相同的SVM模板适用于每个二进制学习者,但您可以通过传递在模板的单元格向量中调整每个二进制学习者的选项。gydF4y2Ba

预测训练样本标签和类别后验概率。在计算标签和类的后验概率时使用gydF4y2Ba“详细”gydF4y2Ba名称-值对的论点。gydF4y2Ba

[标签,〜,〜,后退] = ResubPredict(MDL,gydF4y2Ba“详细”gydF4y2Ba1);gydF4y2Ba
对所有学习者的预测都进行了计算。计算了所有观测的损失。计算后验概率…gydF4y2Ba
mdl.binaryloss.gydF4y2Ba
ans ='二次'gydF4y2Ba

该软件将观察结果分配给产生最小平均二进制损失的班级。由于所有二进制学习器都在计算后验概率,因此二进制损失函数为gydF4y2Ba二次gydF4y2Ba.gydF4y2Ba

显示一组随机的结果。gydF4y2Ba

idx = randsample(大小(X, 1), 10日1);mdl.classnames.gydF4y2Ba
ans =gydF4y2Ba3 x1细胞gydF4y2Ba{'setosa'} {'versicolor'} {'virginica'}gydF4y2Ba
表(Y (idx)、标签(idx)、后(idx:)gydF4y2Ba......gydF4y2Ba'variablenames'gydF4y2Ba, {gydF4y2Ba'truilabel'gydF4y2Ba,gydF4y2Ba“PredLabel”gydF4y2Ba,gydF4y2Ba'后后'gydF4y2Ba})gydF4y2Ba
ans =.gydF4y2Ba10×3表gydF4y2BaTrueLabel PredLabel后路______________ ______________ ______________________________________ { '锦葵'} { '锦葵'} 0.0039322 0.003987 0.99208 { '锦葵'} { '锦葵'} 0.017067 0.018263 0.96467 { '锦葵'} { '锦葵'} 0.014948 0.015856 0.9692 { '云芝'}{'versicolor'} 2.2197e-14 0.87318 0.87318 0.12682 {'setosa'} {'setosa'} {'setosa'} {'setosa'} 0.999 0.0.00025092 0.00074638 {'Versicolor'} {'Versicolor'} {'Versicolor'} {Versicolor'} {versicolor'}2.2194E-14 0.97001 0.029985 {'setosa'} {'setosa'} 0.999 0.00024991 0.0007474 {'versicolor'} {'versicolor'} 0.0085642 0.9859 0.008877 {setosa'} 0.98259 0.0088487gydF4y2Ba

列的列gydF4y2Ba后gydF4y2Ba对应于的类序gydF4y2Bamdl.classnames.gydF4y2Ba.gydF4y2Ba

在观测的预测器空间中定义一个网格值。预测网格中每个实例的后验概率。gydF4y2Ba

xMax = max (X);xMin = min (X);x1Pts = linspace (xMin (1) xMax (1));xMax x2Pts = linspace (xMin (2), (2));[x1Grid, x2Grid] = meshgrid (x1Pts x2Pts);[~, ~, ~, PosteriorRegion] =预测(Mdl, [x1Grid (:), x2Grid (:)));gydF4y2Ba

对于网格上的每个坐标,请在所有类别中绘制最大类后概率。gydF4y2Ba

contourf(x1grid,x2grid,gydF4y2Ba......gydF4y2Ba重塑(max (PosteriorRegion[], 2),大小(x1Grid, 1),大小(x1Grid, 2)));h = colorbar;h.YLabel.String =gydF4y2Ba'最大后后'gydF4y2Ba;h.ylabel.fontsize = 15;抓住gydF4y2Ba在gydF4y2Bagh = g箭偶(x(:,1),x(:,2),y,gydF4y2Ba'krk'gydF4y2Ba,gydF4y2Ba‘* xd‘gydF4y2Ba,8);GH(2).LineWidth = 2;GH(3).LineWidth = 2;标题(gydF4y2Ba“虹膜瓣尺寸和最大后部”gydF4y2Ba)包含(gydF4y2Ba'花瓣长度(cm)'gydF4y2Ba) ylabel (gydF4y2Ba'花瓣宽度(cm)'gydF4y2Ba)轴gydF4y2Ba紧的gydF4y2Ba传奇(GH,gydF4y2Ba“位置”gydF4y2Ba,gydF4y2Ba'西北'gydF4y2Ba) 抓住gydF4y2Ba从gydF4y2Ba

图包含轴。具有标题虹膜花瓣测量和最大后的轴包含4个类型的轮廓,线路。这些对象代表Setosa,Versicolor,Virginica。gydF4y2Ba

训练多类ECOC模型,并用并行计算估计后验概率。gydF4y2Ba

加载gydF4y2Ba心律失常gydF4y2Ba数据集。检查响应数据gydF4y2BaYgydF4y2Ba,并确定类的数量。gydF4y2Ba

负载gydF4y2Ba心律失常gydF4y2BaY =分类(Y);汇总(Y)gydF4y2Ba
值计数百分比1 245 54.20%2 44 9.73%3 15 3.32%4 15 3.32%513 2.88%6 25 5.53%7 3 0.66%8 2 0.44%9 9 1.90%10 50 11.06%14 0.88%11.06%14 0.88%15 5 1.11%16 22 4.87%gydF4y2Ba
K =元素个数(独特(Y));gydF4y2Ba

有几个类没有显示在数据中,而许多其他类的相对频率较低。gydF4y2Ba

指定一个使用了GentleBoost方法的集成学习模板和50个弱分类树学习器。gydF4y2Ba

t = templateEnsemble (gydF4y2Ba“GentleBoost”gydF4y2Ba, 50岁,gydF4y2Ba“树”gydF4y2Ba);gydF4y2Ba

tgydF4y2Ba是模板对象。它的大部分属性是空的(gydF4y2Ba[]gydF4y2Ba).该软件在培训期间使用所有空属性的默认值。gydF4y2Ba

因为响应变量包含许多类,所以指定一个稀疏随机编码设计。gydF4y2Ba

rng (1);gydF4y2Ba%的再现性gydF4y2Ba编码= designecoc (K,gydF4y2Ba'sparserandom'gydF4y2Ba);gydF4y2Ba

使用并行计算训练ECOC模型。指定15%的坚持样本,并拟合后验概率。gydF4y2Ba

池= parpool;gydF4y2Ba%调用工人gydF4y2Ba
使用“local”配置文件启动并行池(parpool)…连接到并行池(工作人员数量:6)。gydF4y2Ba
选择= statset (gydF4y2Ba“UseParallel”gydF4y2Ba,真正的);PMdl = fitcecoc (X, Y,gydF4y2Ba'学习者'gydF4y2Ba,t,gydF4y2Ba“选项”gydF4y2Ba选项,gydF4y2Ba“编码”gydF4y2Ba、编码、gydF4y2Ba......gydF4y2Ba“FitPosterior”gydF4y2Ba,真的,gydF4y2Ba“坚持”gydF4y2Ba,0.15);mdl = pmdl.tromed {1};gydF4y2Ba%提取训练过的紧凑分类器gydF4y2Ba

PMDL.gydF4y2Ba是一个gydF4y2BaClassificationedecoc.gydF4y2Ba模型。它有物业gydF4y2Ba训练有素的gydF4y2Ba,一个1 × 1单元数组,其中包含gydF4y2BaCompactClassificationECOCgydF4y2Ba使用培训集培训的软件的模型。gydF4y2Ba

池调用6个工作人员,但是工作人员的数量可能因系统而异。gydF4y2Ba

估计后验概率,并显示被分类为没有心律失常(第1类)的后验概率,给出一组随机的测试样本观察数据。gydF4y2Ba

testInds =测试(PMdl.Partition);gydF4y2Ba%提取测试指标gydF4y2BaXTest = X (testInds:);欧美= Y (testInds:);[~, ~, ~,后]=预测(Mdl XTest,gydF4y2Ba“选项”gydF4y2Ba,选项);idx = randsample (sum (testInds), 10);表(IDX,YTEST(IDX),后退(IDX,1),gydF4y2Ba......gydF4y2Ba'variablenames'gydF4y2Ba, {gydF4y2Ba“TestSampleIndex”gydF4y2Ba,gydF4y2Ba'truilabel'gydF4y2Ba,gydF4y2Ba'posteriornoarrhalythmia'gydF4y2Ba})gydF4y2Ba
ans =.gydF4y2Ba10×3表gydF4y2BaTestSampleIndex TrueLabel posteriorno心律失常_______________ _________ _____________________ 11 6 0.60631 41 4 0.23674 512 0.13802 33 10 0.43831 12 1 0.94332 8 1 0.97278 37 1 0.62807 24 10 0.96876 56 16 0.29375 30 1 0.64512gydF4y2Ba

输入参数gydF4y2Ba

全部折叠gydF4y2Ba

全或紧凑的多级ECOC模型,指定为gydF4y2BaClassificationECOCgydF4y2Ba或gydF4y2BaCompactClassificationECOCgydF4y2Ba模型对象。gydF4y2Ba

要创建完整或紧凑的ECOC模型,请参见gydF4y2BaClassificationECOCgydF4y2Ba或gydF4y2BaCompactClassificationECOCgydF4y2Ba.gydF4y2Ba

预测数据被分类,指定为数字矩阵或表。gydF4y2Ba

默认情况下,每一行gydF4y2BaXgydF4y2Ba对应于一个观察,并且每列对应于一个变量。gydF4y2Ba

  • 对于数值矩阵:gydF4y2Ba

    • 构成列的变量gydF4y2BaXgydF4y2Ba必须和训练的预测变量有相同的顺序吗gydF4y2BaMdlgydF4y2Ba.gydF4y2Ba

    • 如果你训练gydF4y2BaMdlgydF4y2Ba使用表(例如,gydF4y2BaTBL.gydF4y2Ba), 然后gydF4y2BaXgydF4y2Ba可以是一个数字矩阵,如果gydF4y2BaTBL.gydF4y2Ba包含所有数值预测变量。处理数值预测gydF4y2BaTBL.gydF4y2Ba作为培训期间的分类,使用该识别分类预测因子gydF4y2Ba分类预测器gydF4y2Ba的名称-值对参数gydF4y2Bafitcecoc.gydF4y2Ba.如果gydF4y2BaTBL.gydF4y2Ba包含异构的预测变量(例如,数字和分类数据类型)和gydF4y2BaXgydF4y2Ba是一个数值矩阵,那么gydF4y2Ba预测gydF4y2Ba抛出错误。gydF4y2Ba

  • 对于表:gydF4y2Ba

    • 预测gydF4y2Ba不支持字符向量的单金宝app元格阵列以外的多列变量或单元格阵列。gydF4y2Ba

    • 如果你训练gydF4y2BaMdlgydF4y2Ba使用表(例如,gydF4y2BaTBL.gydF4y2Ba),然后所有预测器变量都在gydF4y2BaXgydF4y2Ba必须具有与火车的预测变量相同的变量名称和数据类型gydF4y2BaMdlgydF4y2Ba(存储在gydF4y2BaMdl。PredictorNamesgydF4y2Ba).但是,的列顺序gydF4y2BaXgydF4y2Ba不需要对应的列顺序gydF4y2BaTBL.gydF4y2Ba.这两个gydF4y2BaTBL.gydF4y2Ba和gydF4y2BaXgydF4y2Ba可以包含额外的变量(响应变量、观察权重等),但是gydF4y2Ba预测gydF4y2Ba忽略了它们。gydF4y2Ba

    • 如果你训练gydF4y2BaMdlgydF4y2Ba使用数字矩阵,然后是预测器名称gydF4y2BaMdl。PredictorNamesgydF4y2Ba和相应的预测变量名称gydF4y2BaXgydF4y2Ba肯定是一样的。要在训练期间指定预测器名称,请参见gydF4y2BaPredictorNamesgydF4y2Ba的名称-值对参数gydF4y2Bafitcecoc.gydF4y2Ba.所有的预测变量gydF4y2BaXgydF4y2Ba必须是数字向量。gydF4y2BaXgydF4y2Ba可以包含额外的变量(响应变量、观察权重等),但是gydF4y2Ba预测gydF4y2Ba忽略了它们。gydF4y2Ba

请注意gydF4y2Ba

如果gydF4y2Bamdl.binarylearners.gydF4y2Ba包含线性分类模型(gydF4y2Ba分类线性gydF4y2Ba),然后您可以对预测器矩阵进行定位,使观察结果对应列并指定gydF4y2Ba'观察','列'gydF4y2Ba.但是,您不能指定gydF4y2Ba'观察','列'gydF4y2Ba用于表中的预测器数据。gydF4y2Ba

训练时gydF4y2BaMdlgydF4y2Ba,假设你设置gydF4y2Ba“标准化”,真的gydF4y2Ba对于指定的模板对象gydF4y2Ba“学习者”gydF4y2Ba的名称-值对参数gydF4y2Bafitcecoc.gydF4y2Ba.在这种情况下,对于相应的二进制学习者gydF4y2BajgydF4y2Ba,软件使用相应的手段标准化新的预测器数据的列gydF4y2BaMdl.BinaryLearner {j} .MugydF4y2Ba的标准差gydF4y2Bamdl.binarylearner {j} .sigmagydF4y2Ba.gydF4y2Ba

数据类型:gydF4y2Ba表格gydF4y2Ba|gydF4y2Ba双倍的gydF4y2Ba|gydF4y2Ba单gydF4y2Ba

名称-值对的观点gydF4y2Ba

指定可选的逗号分隔的对gydF4y2Ba名称,值gydF4y2Ba论点。gydF4y2Ba的名字gydF4y2Ba参数名和gydF4y2Ba价值gydF4y2Ba为对应值。gydF4y2Ba的名字gydF4y2Ba必须出现在引号内。可以以任意顺序指定多个名称和值对参数gydF4y2Baname1,value1,...,namen,valuengydF4y2Ba.gydF4y2Ba

例子:gydF4y2Ba预测(MDL,X,'BinaryLoss','二次','解码','丢失')gydF4y2Ba指定二进制二进制学习函数和基于丢失的解码方案,用于聚合二进制损耗。gydF4y2Ba

二元学习器损失函数,指定为逗号分隔对,由gydF4y2Ba'二元乐'gydF4y2Ba以及内置的损失函数名或函数句柄。gydF4y2Ba

  • 该表描述了内置函数,其中gydF4y2BaygydF4y2BajgydF4y2Ba是一个特定二元学习者的类标签(在集合{- 1,1,0}中),gydF4y2Ba年代gydF4y2BajgydF4y2Ba分数是否供观察gydF4y2BajgydF4y2Ba,gydF4y2BaggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)是二进制损失公式。gydF4y2Ba

    价值gydF4y2Ba 描述gydF4y2Ba 分数域gydF4y2Ba ggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)gydF4y2Ba
    “binodeviance”gydF4y2Ba 二项式偏差gydF4y2Ba (-∞∞)gydF4y2Ba 日志(1 + exp (2gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
    '指数'gydF4y2Ba 幂数gydF4y2Ba (-∞∞)gydF4y2Ba exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba)/ 2gydF4y2Ba
    “汉明”gydF4y2Ba 汉明gydF4y2Ba [0,1]或( - ∞,∞)gydF4y2Ba [1 -符号(gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
    “枢纽”gydF4y2Ba 铰链gydF4y2Ba (-∞∞)gydF4y2Ba max(0,1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba)/ 2gydF4y2Ba
    “线性”gydF4y2Ba 线性gydF4y2Ba (-∞∞)gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba)/ 2gydF4y2Ba
    分对数的gydF4y2Ba 物流gydF4y2Ba (-∞∞)gydF4y2Ba 日志[1 + exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
    '二次'gydF4y2Ba 二次gydF4y2Ba [0, 1]gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba(2gydF4y2Ba年代gydF4y2BajgydF4y2Ba- 1))gydF4y2Ba2gydF4y2Ba/2gydF4y2Ba

    该软件使二进制损失正常化,因此损失是0.5时gydF4y2BaygydF4y2BajgydF4y2Ba= 0.此外,软件计算每个类的平均二进制损耗。gydF4y2Ba

  • 例如,对于自定义二进制丢失函数gydF4y2BacustomFunctiongydF4y2Ba,指定其功能句柄gydF4y2BaBinaryLoss, @customFunctiongydF4y2Ba.gydF4y2Ba

    customFunctiongydF4y2Ba有这个形式:gydF4y2Ba

    布劳斯= customFunction (M s)gydF4y2Ba
    地点:gydF4y2Ba

    • 米gydF4y2Ba是gydF4y2BaKgydF4y2Ba-经过-gydF4y2BalgydF4y2Ba存储在gydF4y2BaMdl。CodingMatrixgydF4y2Ba.gydF4y2Ba

    • 年代gydF4y2Ba是1 -gydF4y2BalgydF4y2Ba分类得分的行矢量。gydF4y2Ba

    • 布劳斯gydF4y2Ba是分类损失。这个标量集合了特定班级中每个学习者的二进制损失。例如,您可以使用平均二进制损失来汇总每个类的学习者的损失。gydF4y2Ba

    • KgydF4y2Ba为类数。gydF4y2Ba

    • lgydF4y2Ba是二元学习者的数量。gydF4y2Ba

    有关传递自定义二进制损耗函数的示例,请参见gydF4y2Ba用自定义二元损耗函数预测ECOC模型的试样标签gydF4y2Ba.gydF4y2Ba

默认的gydF4y2BaBinaryLossgydF4y2Ba值取决于二进制学习者返回的分数范围。此表介绍了一些默认值gydF4y2BaBinaryLossgydF4y2Ba基于给定假设的值。gydF4y2Ba

假设gydF4y2Ba 默认值gydF4y2Ba
所有二进制学习者都是SVM学习者的SVM或线性或内核分类模型。gydF4y2Ba “枢纽”gydF4y2Ba
所有的二元学习者都是由gydF4y2Baadaboostm1.gydF4y2Ba或gydF4y2BaGentleBoostgydF4y2Ba.gydF4y2Ba '指数'gydF4y2Ba
所有的二元学习者都是由gydF4y2BaLogitboost.gydF4y2Ba.gydF4y2Ba “binodeviance”gydF4y2Ba
所有二元学习者都是logistic回归学习者的线性或核分类模型。或者,你指定通过设置来预测类的后验概率gydF4y2Ba'fitposterior',真实gydF4y2Ba在gydF4y2Bafitcecoc.gydF4y2Ba.gydF4y2Ba '二次'gydF4y2Ba

要检查默认值,请使用点表示法显示gydF4y2BaBinaryLossgydF4y2Ba属性的训练模型在命令行。gydF4y2Ba

例子:gydF4y2Ba“BinaryLoss”、“binodeviance”gydF4y2Ba

数据类型:gydF4y2BachargydF4y2Ba|gydF4y2Ba细绳gydF4y2Ba|gydF4y2Bafunction_handlegydF4y2Ba

聚合二进制损失的解码方案,指定为由。组成的逗号分隔对gydF4y2Ba“解码”gydF4y2Ba和gydF4y2Ba“lossweighted”gydF4y2Ba或gydF4y2Ba“lossbased”gydF4y2Ba.有关更多信息,请参阅gydF4y2Ba二进制损失gydF4y2Ba.gydF4y2Ba

例子:gydF4y2Ba“解码”、“lossbased”gydF4y2Ba

通过Kullback-Leibler散度最小化拟合后验概率的随机初值数,指定为逗号分隔对,由gydF4y2Ba'numklinitializations'gydF4y2Ba和一个非负整数标量。gydF4y2Ba

如果您未请求第四个输出参数(gydF4y2Ba后gydF4y2Ba)和组gydF4y2Ba'posteriormethod','kl'gydF4y2Ba(默认值),那么软件忽略了值gydF4y2Banumklinitializations.gydF4y2Ba.gydF4y2Ba

有关更多详细信息,请参阅gydF4y2Ba使用Kullback-Leibler发散的后估计gydF4y2Ba.gydF4y2Ba

例子:gydF4y2Ba“NumKLInitializations”,5gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双倍的gydF4y2Ba

预测器数据观测维数,由指定的逗号分隔对组成gydF4y2Ba'观察'gydF4y2Ba和gydF4y2Ba“列”gydF4y2Ba或gydF4y2Ba“行”gydF4y2Ba.gydF4y2Bamdl.binarylearners.gydF4y2Ba必须包含gydF4y2Ba分类线性gydF4y2Ba楷模。gydF4y2Ba

请注意gydF4y2Ba

如果您对预测器矩阵进行定位,使观察结果与列对应并指定gydF4y2Ba'观察','列'gydF4y2Ba,可以显著减少执行时间。你不能指定gydF4y2Ba'观察','列'gydF4y2Ba用于表中的预测器数据。gydF4y2Ba

估算选项,指定为逗号分隔对组成gydF4y2Ba“选项”gydF4y2Ba和返回的结构数组gydF4y2Ba实例化gydF4y2Ba.gydF4y2Ba

要调用并行计算:gydF4y2Ba

  • 您需要一个并行计算工具箱™许可证。gydF4y2Ba

  • 指定gydF4y2Ba'选项',statset('deverypallellel',true)gydF4y2Ba.gydF4y2Ba

后概率估计方法,指定为逗号分隔对组成gydF4y2Ba“PosteriorMethod”gydF4y2Ba和gydF4y2Ba“吉隆坡”gydF4y2Ba或gydF4y2Ba“qp”gydF4y2Ba.gydF4y2Ba

  • 如果gydF4y2BaPosteriormethod.gydF4y2Ba是gydF4y2Ba“吉隆坡”gydF4y2Ba然后,软件通过最小化二进制学习者返回的预测和预期的后验概率之间的kullback-leibler发散来估计多字符后概率。有关详细信息,请参阅gydF4y2Ba使用Kullback-Leibler发散的后估计gydF4y2Ba.gydF4y2Ba

  • 如果gydF4y2BaPosteriormethod.gydF4y2Ba是gydF4y2Ba“qp”gydF4y2Ba,利用二次规划求解最小二乘问题,估计多类后验概率。您需要一个Optimization Toolbox™许可才能使用此选项。有关详细信息,请参阅gydF4y2Ba使用二次编程的后估计gydF4y2Ba.gydF4y2Ba

  • 如果您未请求第四个输出参数(gydF4y2Ba后gydF4y2Ba),则该软件忽略的价值gydF4y2BaPosteriormethod.gydF4y2Ba.gydF4y2Ba

例子:gydF4y2Ba“PosteriorMethod”、“qp”gydF4y2Ba

详细程度,指定为逗号分隔对,由gydF4y2Ba“详细”gydF4y2Ba和gydF4y2Ba0gydF4y2Ba或gydF4y2Ba1gydF4y2Ba.gydF4y2Ba详细的gydF4y2Ba控制软件在命令窗口中显示的诊断消息的数量。gydF4y2Ba

如果gydF4y2Ba详细的gydF4y2Ba是gydF4y2Ba0gydF4y2Ba,则该软件不会显示诊断消息。否则,软件将显示诊断消息。gydF4y2Ba

例子:gydF4y2Ba'verbose',1gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双倍的gydF4y2Ba

输出参数gydF4y2Ba

全部折叠gydF4y2Ba

预测类标签,作为分类,字符,逻辑或数字阵列,或字符向量的小区数组。该软件通过将观察分配给阶级的观察来预测观察的分类,产生最大的否定平均二进制损失(或等效,平均二进制损失最小)。gydF4y2Ba

标签gydF4y2Ba是否具有与用于培训的类标签相同的数据类型gydF4y2BaMdlgydF4y2Ba行数和gydF4y2BaXgydF4y2Ba.gydF4y2Ba(该软件将字符串数组视为字符向量的单元格数组。)gydF4y2Ba

如果gydF4y2Bamdl.binarylearners.gydF4y2Ba包含gydF4y2Ba分类线性gydF4y2Ba模型,然后gydF4y2Ba标签gydF4y2Ba是一个gydF4y2Ba米gydF4y2Ba-经过-gydF4y2BalgydF4y2Ba矩阵,gydF4y2Ba米gydF4y2Ba观察的次数在吗gydF4y2BaXgydF4y2Ba,gydF4y2BalgydF4y2Ba是线性分类模型中的正则化强度的数量(gydF4y2Banumel(mdl.binarylearners {1} .lambda)gydF4y2Ba).的值gydF4y2Ba标签(i, j)gydF4y2Ba是预测的观察标签gydF4y2Ba我gydF4y2Ba用于正则化强度训练的模型gydF4y2Bamdl.binarylearners {1} .lambda(j)gydF4y2Ba.gydF4y2Ba

除此以外,gydF4y2Ba标签gydF4y2Ba列向量是长度的吗gydF4y2Ba米gydF4y2Ba.gydF4y2Ba

否定平均gydF4y2Ba二进制损失gydF4y2Ba,以数字矩阵或数组的形式返回。gydF4y2Ba

  • 如果gydF4y2Bamdl.binarylearners.gydF4y2Ba包含gydF4y2Ba分类线性gydF4y2Ba模型,然后gydF4y2BaNegLossgydF4y2Ba是一个gydF4y2Ba米gydF4y2Ba-经过-gydF4y2BaKgydF4y2Ba-经过-gydF4y2BalgydF4y2Ba大批。gydF4y2Ba

    • 米gydF4y2Ba观察的次数在吗gydF4y2BaXgydF4y2Ba.gydF4y2Ba

    • KgydF4y2Ba为训练数据中不同类的个数(gydF4y2Ba元素个数(Mdl.ClassNames)gydF4y2Ba).gydF4y2Ba

    • lgydF4y2Ba是线性分类模型中的正则化强度的数量(gydF4y2Banumel(mdl.binarylearners {1} .lambda)gydF4y2Ba).gydF4y2Ba

    NegLoss (k, j)gydF4y2Ba是观察的否定平均二进制损失gydF4y2Ba我gydF4y2Ba,对应上课gydF4y2BaMdl.ClassNames (k)gydF4y2Ba,对于使用正则化强度训练的模型gydF4y2Bamdl.binarylearners {1} .lambda(j)gydF4y2Ba.gydF4y2Ba

  • 除此以外,gydF4y2BaNegLossgydF4y2Ba是一个gydF4y2Ba米gydF4y2Ba-经过-gydF4y2BaKgydF4y2Ba矩阵。gydF4y2Ba

每个二进制学习者的正数类分数,以数字矩阵或数组的形式返回。gydF4y2Ba

  • 如果gydF4y2Bamdl.binarylearners.gydF4y2Ba包含gydF4y2Ba分类线性gydF4y2Ba模型,然后gydF4y2BaPBScoregydF4y2Ba是一个gydF4y2Ba米gydF4y2Ba-经过-gydF4y2BaBgydF4y2Ba-经过-gydF4y2BalgydF4y2Ba大批。gydF4y2Ba

    • 米gydF4y2Ba观察的次数在吗gydF4y2BaXgydF4y2Ba.gydF4y2Ba

    • BgydF4y2Ba是二进制学习者的数量(gydF4y2Banumel(mdl.binarylearners)gydF4y2Ba).gydF4y2Ba

    • lgydF4y2Ba是线性分类模型中的正则化强度的数量(gydF4y2Banumel(mdl.binarylearners {1} .lambda)gydF4y2Ba).gydF4y2Ba

    PBScore(我,b, j)gydF4y2Ba是积极阶级的观察分数gydF4y2Ba我gydF4y2Ba,使用二元学习器gydF4y2BabgydF4y2Ba,对于使用正则化强度训练的模型gydF4y2Bamdl.binarylearners {1} .lambda(j)gydF4y2Ba.gydF4y2Ba

  • 除此以外,gydF4y2BaPBScoregydF4y2Ba是一个gydF4y2Ba米gydF4y2Ba-经过-gydF4y2BaBgydF4y2Ba矩阵。gydF4y2Ba

后验类概率,作为数字矩阵或数组返回。gydF4y2Ba

  • 如果gydF4y2Bamdl.binarylearners.gydF4y2Ba包含gydF4y2Ba分类线性gydF4y2Ba模型,然后gydF4y2Ba后gydF4y2Ba是一个gydF4y2Ba米gydF4y2Ba-经过-gydF4y2BaKgydF4y2Ba-经过-gydF4y2BalgydF4y2Ba大批。对于维度定义,请参阅gydF4y2BaNegLossgydF4y2Ba.gydF4y2Ba后(I,K,J)gydF4y2Ba后验概率是观察值吗gydF4y2Ba我gydF4y2Ba来自类gydF4y2BaMdl.ClassNames (k)gydF4y2Ba,对于使用正则化强度训练的模型gydF4y2Bamdl.binarylearners {1} .lambda(j)gydF4y2Ba.gydF4y2Ba

  • 除此以外,gydF4y2Ba后gydF4y2Ba是一个gydF4y2Ba米gydF4y2Ba-经过-gydF4y2BaKgydF4y2Ba矩阵。gydF4y2Ba

更多关于gydF4y2Ba

全部折叠gydF4y2Ba

二进制损失gydF4y2Ba

一个gydF4y2Ba二进制损失gydF4y2Ba是类和分类分数的函数,它决定二元学习者如何将观察结果分类到类中。gydF4y2Ba

假设如下:gydF4y2Ba

  • 米gydF4y2BakjgydF4y2Ba是元素(gydF4y2BakgydF4y2Ba,gydF4y2BajgydF4y2Ba)的编码设计矩阵gydF4y2Ba米gydF4y2Ba(即,对应于类的代码gydF4y2BakgydF4y2Ba二进制的学习者gydF4y2BajgydF4y2Ba).gydF4y2Ba

  • 年代gydF4y2BajgydF4y2Ba是二进制学习者的分数gydF4y2BajgydF4y2Ba为了观察。gydF4y2Ba

  • ggydF4y2Ba为二进制损失函数。gydF4y2Ba

  • kgydF4y2Ba ^gydF4y2Ba 是观测的预测类。gydF4y2Ba

在gydF4y2Ba通过解码gydF4y2Ba(Escalera等。)gydF4y2Ba,对二进制学习者产生最小二进制损失和的类决定了观测的预测类,即,gydF4y2Ba

kgydF4y2Ba ^gydF4y2Ba =gydF4y2Ba argmingydF4y2Ba kgydF4y2Ba σ.gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba |gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba |gydF4y2Ba ggydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba jgydF4y2Ba )gydF4y2Ba .gydF4y2Ba

在gydF4y2Ba损失加权解码gydF4y2Ba(Escalera等。)gydF4y2Ba,制作二进制学习者二进制损失的最小平均值的阶级决定了预测的观察类,即gydF4y2Ba

kgydF4y2Ba ^gydF4y2Ba =gydF4y2Ba argmingydF4y2Ba kgydF4y2Ba σ.gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba |gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba |gydF4y2Ba ggydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba jgydF4y2Ba )gydF4y2Ba σ.gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba |gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba |gydF4y2Ba .gydF4y2Ba

allwein等。gydF4y2Ba提出损耗加权译码通过将所有类的损耗值保持在相同的动态范围内来提高分类精度。gydF4y2Ba

该表总结了支持的损耗函数,其中金宝appgydF4y2BaygydF4y2BajgydF4y2Ba是一个特定二元学习者的类标签(在集合{- 1,1,0}中),gydF4y2Ba年代gydF4y2BajgydF4y2Ba分数是否供观察gydF4y2BajgydF4y2Ba,gydF4y2BaggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba).gydF4y2Ba

价值gydF4y2Ba 描述gydF4y2Ba 分数域gydF4y2Ba ggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)gydF4y2Ba
“binodeviance”gydF4y2Ba 二项式偏差gydF4y2Ba (-∞∞)gydF4y2Ba 日志(1 + exp (2gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
'指数'gydF4y2Ba 幂数gydF4y2Ba (-∞∞)gydF4y2Ba exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba)/ 2gydF4y2Ba
“汉明”gydF4y2Ba 汉明gydF4y2Ba [0,1]或( - ∞,∞)gydF4y2Ba [1 -符号(gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
“枢纽”gydF4y2Ba 铰链gydF4y2Ba (-∞∞)gydF4y2Ba max(0,1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba)/ 2gydF4y2Ba
“线性”gydF4y2Ba 线性gydF4y2Ba (-∞∞)gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba)/ 2gydF4y2Ba
分对数的gydF4y2Ba 物流gydF4y2Ba (-∞∞)gydF4y2Ba 日志[1 + exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
'二次'gydF4y2Ba 二次gydF4y2Ba [0, 1]gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba(2gydF4y2Ba年代gydF4y2BajgydF4y2Ba- 1))gydF4y2Ba2gydF4y2Ba/2gydF4y2Ba

该软件使二进制损失正常化,当损失是0.5gydF4y2BaygydF4y2BajgydF4y2Ba= 0,并使用二进制学习者的平均值进行聚合gydF4y2Ba[Allwein等]gydF4y2Ba.gydF4y2Ba

不要将二进制丢失与整体分类损失混淆(由此指定)gydF4y2Ba“LossFun”gydF4y2Ba的名称-值对参数gydF4y2Ba损失gydF4y2Ba和gydF4y2Ba预测gydF4y2Ba对象函数),测量Ecoc分类器整体执行的良好。gydF4y2Ba

算法gydF4y2Ba

全部折叠gydF4y2Ba

该软件可以通过最小化Kullback-Leibler发散或使用二次规划来估计类后验概率。对于后验估计算法的如下描述,假设:gydF4y2Ba

  • 米gydF4y2BakjgydF4y2Ba是元素(gydF4y2BakgydF4y2Ba,gydF4y2BajgydF4y2Ba)的编码设计矩阵gydF4y2Ba米gydF4y2Ba.gydF4y2Ba

  • 我gydF4y2Ba为指标函数。gydF4y2Ba

  • pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba 类的后验概率是类的估计吗gydF4y2BakgydF4y2Ba观察,gydF4y2BakgydF4y2Ba= 1,…,gydF4y2BaKgydF4y2Ba.gydF4y2Ba

  • rgydF4y2BajgydF4y2Ba二进制学习者的正类后验概率是多少gydF4y2BajgydF4y2Ba.那是,gydF4y2BargydF4y2BajgydF4y2Ba二进制学习者的概率是二元学习者的概率gydF4y2BajgydF4y2Ba考虑到培训数据,将观察分类为正类。gydF4y2Ba

使用Kullback-Leibler发散的后估计gydF4y2Ba

默认情况下,该软件将Kullback-Leibler差异最小化,以估计类后验概率。期望的正类后验概率与观测到的正类后验概率之间的Kullback-Leibler差异为gydF4y2Ba

δ.gydF4y2Ba (gydF4y2Ba rgydF4y2Ba ,gydF4y2Ba rgydF4y2Ba ^gydF4y2Ba )gydF4y2Ba =gydF4y2Ba σ.gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba wgydF4y2Ba jgydF4y2Ba [gydF4y2Ba rgydF4y2Ba jgydF4y2Ba 日志gydF4y2Ba rgydF4y2Ba jgydF4y2Ba rgydF4y2Ba ^gydF4y2Ba jgydF4y2Ba +gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba -gydF4y2Ba rgydF4y2Ba jgydF4y2Ba )gydF4y2Ba 日志gydF4y2Ba 1gydF4y2Ba -gydF4y2Ba rgydF4y2Ba jgydF4y2Ba 1gydF4y2Ba -gydF4y2Ba rgydF4y2Ba ^gydF4y2Ba jgydF4y2Ba ]gydF4y2Ba ,gydF4y2Ba

在哪里gydF4y2Ba wgydF4y2Ba jgydF4y2Ba =gydF4y2Ba σ.gydF4y2Ba 年代gydF4y2Ba jgydF4y2Ba wgydF4y2Ba 我gydF4y2Ba *gydF4y2Ba 是二进制学习者的重量gydF4y2BajgydF4y2Ba.gydF4y2Ba

  • 年代gydF4y2BajgydF4y2Ba是二进制学习者的观察指数集gydF4y2BajgydF4y2Ba训练有素。gydF4y2Ba

  • wgydF4y2Ba 我gydF4y2Ba *gydF4y2Ba 观察的权重是多少gydF4y2Ba我gydF4y2Ba.gydF4y2Ba

该软件迭代最大限度地降低分歧。第一步是选择初始值gydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba (gydF4y2Ba 0gydF4y2Ba )gydF4y2Ba ;gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba ......gydF4y2Ba ,gydF4y2Ba KgydF4y2Ba 对于类的后验概率。gydF4y2Ba

  • 如果没有指定gydF4y2Ba“NumKLIterations”gydF4y2Ba,然后软件尝试下面描述的两组确定性初值,并选择使Δ最小化的集合。gydF4y2Ba

    • pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba (gydF4y2Ba 0gydF4y2Ba )gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba /gydF4y2Ba KgydF4y2Ba ;gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba ......gydF4y2Ba ,gydF4y2Ba KgydF4y2Ba .gydF4y2Ba

    • pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba (gydF4y2Ba 0gydF4y2Ba )gydF4y2Ba ;gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba ......gydF4y2Ba ,gydF4y2Ba KgydF4y2Ba 方程组的解是多少gydF4y2Ba

      米gydF4y2Ba 01gydF4y2Ba pgydF4y2Ba ^gydF4y2Ba (gydF4y2Ba 0gydF4y2Ba )gydF4y2Ba =gydF4y2Ba rgydF4y2Ba ,gydF4y2Ba

      在哪里gydF4y2Ba米gydF4y2Ba01gydF4y2Ba是gydF4y2Ba米gydF4y2Ba与所有gydF4y2Ba米gydF4y2BakjgydF4y2Ba= -1替换为0gydF4y2BargydF4y2Ba是返回的积极级后概率的矢量gydF4y2BalgydF4y2Ba二进制学习者gydF4y2Ba(Dietterich等。)gydF4y2Ba.软件使用gydF4y2BalsqnonneggydF4y2Ba解决系统。gydF4y2Ba

  • 如果您指定gydF4y2Ba“NumKLIterations”,cgydF4y2Ba, 在哪里gydF4y2BacgydF4y2Ba是自然数,那么软件做下面的选择集呢gydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba (gydF4y2Ba 0gydF4y2Ba )gydF4y2Ba ;gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba ......gydF4y2Ba ,gydF4y2Ba KgydF4y2Ba ,并选择最小化Δ的集合。gydF4y2Ba

    • 如前所述,软件会尝试这两组确定的初始值。gydF4y2Ba

    • 软件随机生成gydF4y2BacgydF4y2Ba向量的长度gydF4y2BaKgydF4y2Ba使用gydF4y2Ba兰德gydF4y2Ba,然后将每个向量的和归一。gydF4y2Ba

在迭代gydF4y2BatgydF4y2Ba,软件完成以下步骤:gydF4y2Ba

  1. 计算gydF4y2Ba

    rgydF4y2Ba ^gydF4y2Ba jgydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba =gydF4y2Ba σ.gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba KgydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba =gydF4y2Ba +gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba σ.gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba KgydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba =gydF4y2Ba +gydF4y2Ba 1gydF4y2Ba ∪gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba =gydF4y2Ba -gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba .gydF4y2Ba

  2. 估计下一类后验概率gydF4y2Ba

    pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba (gydF4y2Ba tgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba =gydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba σ.gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba wgydF4y2Ba jgydF4y2Ba [gydF4y2Ba rgydF4y2Ba jgydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba =gydF4y2Ba +gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba +gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba -gydF4y2Ba rgydF4y2Ba jgydF4y2Ba )gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba =gydF4y2Ba -gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba ]gydF4y2Ba σ.gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba wgydF4y2Ba jgydF4y2Ba [gydF4y2Ba rgydF4y2Ba ^gydF4y2Ba jgydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba =gydF4y2Ba +gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba +gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba -gydF4y2Ba rgydF4y2Ba ^gydF4y2Ba jgydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba )gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba =gydF4y2Ba -gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba ]gydF4y2Ba .gydF4y2Ba

  3. 正常化gydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba (gydF4y2Ba tgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba ;gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba ......gydF4y2Ba ,gydF4y2Ba KgydF4y2Ba 所以它们的和是1。gydF4y2Ba

  4. 检查收敛。gydF4y2Ba

有关更多详细信息,请参阅gydF4y2Ba(Hastie等。)gydF4y2Ba和gydF4y2Ba(Zadrozny)gydF4y2Ba.gydF4y2Ba

使用二次编程的后估计gydF4y2Ba

使用二次编程的后验概率估计需要优化工具箱许可证。为了使用此方法估计用于观察的后验概率,软件完成了以下步骤:gydF4y2Ba

  1. 估计正类后验概率,gydF4y2BargydF4y2BajgydF4y2Ba,二进制学习者gydF4y2BajgydF4y2Ba= 1,…,gydF4y2BalgydF4y2Ba.gydF4y2Ba

  2. 利用gydF4y2BargydF4y2BajgydF4y2Ba和gydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba [Wu等人]gydF4y2Ba,最大限度地减少gydF4y2Ba

    σ.gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba [gydF4y2Ba -gydF4y2Ba rgydF4y2Ba jgydF4y2Ba σ.gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba KgydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba =gydF4y2Ba -gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba +gydF4y2Ba (gydF4y2Ba 1gydF4y2Ba -gydF4y2Ba rgydF4y2Ba jgydF4y2Ba )gydF4y2Ba σ.gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba KgydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba =gydF4y2Ba +gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba ]gydF4y2Ba 2gydF4y2Ba

    关于gydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba 和限制gydF4y2Ba

    0gydF4y2Ba ≤.gydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba ≤.gydF4y2Ba 1gydF4y2Ba σ.gydF4y2Ba kgydF4y2Ba pgydF4y2Ba ^gydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1.gydF4y2Ba

    该软件执行最小化使用gydF4y2BaquadproggydF4y2Ba(优化工具箱)gydF4y2Ba.gydF4y2Ba

参考gydF4y2Ba

艾尔温,E.夏皮尔,Y.辛格。《将多类减少为二进制:一种统一的保证金分类方法》。gydF4y2Ba机器学习研究杂志gydF4y2Ba.2000年第1卷,113-141页。gydF4y2Ba

[2] Dietterich,T.和G. Bakiri。“通过纠错输出代码来解决多字母学习问题。”gydF4y2Ba人工智能研究杂志gydF4y2Ba.第2卷,1995年,263-286页。gydF4y2Ba

Pujol, S. Escalera, S. O. Pujol, P. Radeva。《论三元纠错输出码的译码过程》。gydF4y2Ba模式分析与机器智能学报gydF4y2Ba.卷。32,第7号,2010年第70页,第120-134页。gydF4y2Ba

[4] Escalera,S.,O. Pujol和P. Radeva。“用于纠错输出代码稀疏设计的三元代码的可分离。”gydF4y2Ba模式识别gydF4y2Ba.2009年第30卷第3期285-297页。gydF4y2Ba

[5] Hastie,T.和R. Tibshirani。“通过成对耦合进行分类。”gydF4y2Ba统计数据gydF4y2Ba.1998年第26卷第2期第451-471页。gydF4y2Ba

吴廷锋,林春杰,翁仁。“基于成对耦合的多类别分类的概率估计”。gydF4y2Ba机器学习研究杂志gydF4y2Ba.卷。5,2004,PP。975-1005。gydF4y2Ba

[7] zrozny,“通过耦合概率估计将多类分解为二进制”。gydF4y2BaNIPS 2001:神经信息处理系统的进步程序14gydF4y2Ba, 2001,第1041-1048页。gydF4y2Ba

扩展功能gydF4y2Ba

在R2014B中介绍gydF4y2Ba