主要内容GYdF4y2Ba

kfoldMarginGYdF4y2Ba

训练中未使用的观察值的分类边距GYdF4y2Ba

描述GYdF4y2Ba

例子GYdF4y2Ba

MGYdF4y2Ba=kfoldMargin(GYdF4y2BaCVMdlGYdF4y2Ba)GYdF4y2Ba返回旨在GYdF4y2Ba分类边距GYdF4y2Ba获得的GYdF4y2BaCVMdlGYdF4y2Ba,这是由线性分类模型组成的交叉验证的纠错输出代码(ECOC)模型。也就是说,对于每一个折叠,GYdF4y2BakfoldMarginGYdF4y2Ba估计分类边距,了解它在使用所有其他观察时培训它的观察结果。GYdF4y2Ba

MGYdF4y2Ba包含线性分类模型中每个正规化强度的分类边距GYdF4y2BaCVMdlGYdF4y2Ba.GYdF4y2Ba

例子GYdF4y2Ba

MGYdF4y2Ba=kfoldMargin(GYdF4y2BaCVMdlGYdF4y2Ba,GYdF4y2Ba名称、值GYdF4y2Ba)GYdF4y2Ba使用一个或多个指定的其他选项GYdF4y2Ba名称、值GYdF4y2Ba对论点。例如,指定解码方案或详细级别。GYdF4y2Ba

输入参数GYdF4y2Ba

全部展开GYdF4y2Ba

交叉验证,ECOC模型由线性分类模型组成,指定为GYdF4y2BaClassificationedAdearecoc.GYdF4y2Ba模型对象。您可以创建GYdF4y2BaClassificationedAdearecoc.GYdF4y2Ba模型使用GYdF4y2BaFitcecoc.GYdF4y2Ba并通过:GYdF4y2Ba

  1. 例如,指定任何一个交叉验证、名称-值对参数,GYdF4y2Ba克罗斯瓦尔GYdF4y2Ba

  2. 设置名称值对参数GYdF4y2Ba学习者GYdF4y2Ba到GYdF4y2Ba'线性'GYdF4y2Ba或由返回的线性分类模型模板GYdF4y2BaTemplateLinear.GYdF4y2Ba

为了获得估计,kfoldmargin适用于用于交叉验证ECOC模型的相同数据(GYdF4y2BaXGYdF4y2Ba和GYdF4y2BaYGYdF4y2Ba).GYdF4y2Ba

名称-值对参数GYdF4y2Ba

指定可选的逗号分隔的字符对GYdF4y2Ba名称、值GYdF4y2Ba参数。GYdF4y2Ba姓名GYdF4y2Ba是参数名和GYdF4y2Ba价值GYdF4y2Ba是相应的价值。GYdF4y2Ba姓名GYdF4y2Ba必须出现在引号内。您可以以任何顺序指定多个名称和值对参数GYdF4y2BaName1, Value1,…,的家GYdF4y2Ba.GYdF4y2Ba

二元学习器损失函数,指定为逗号分隔对,由GYdF4y2Ba“BinaryLoss”GYdF4y2Ba以及一个内置的丢失函数名或函数句柄。GYdF4y2Ba

  • 此表包含内置函数的名称和描述,其中GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba是特定二进制学习器的类标签(在集合{-1,1,0}中),GYdF4y2BasGYdF4y2BaJGYdF4y2Ba分数是否供观察GYdF4y2BaJGYdF4y2Ba, 和GYdF4y2BaGGYdF4y2Ba(GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba,GYdF4y2BasGYdF4y2BaJGYdF4y2Ba)为二进制损耗公式。GYdF4y2Ba

    价值GYdF4y2Ba 描述GYdF4y2Ba 得分领域GYdF4y2Ba GGYdF4y2Ba(GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba,GYdF4y2BasGYdF4y2BaJGYdF4y2Ba)GYdF4y2Ba
    “偏差”GYdF4y2Ba 二项式偏差GYdF4y2Ba (–∞,∞)GYdF4y2Ba 日志[1 + exp(-2GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba)] / [2log(2)]GYdF4y2Ba
    “指数”GYdF4y2Ba 指数GYdF4y2Ba (–∞,∞)GYdF4y2Ba exp( -GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba) / 2GYdF4y2Ba
    “哈明”GYdF4y2Ba 哈明GYdF4y2Ba [0,1]或( - ∞,∞)GYdF4y2Ba [1–签名(GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba)] / 2GYdF4y2Ba
    '合页'GYdF4y2Ba 铰链GYdF4y2Ba (–∞,∞)GYdF4y2Ba max(0,1 -GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba) / 2GYdF4y2Ba
    '线性'GYdF4y2Ba 线性的GYdF4y2Ba (–∞,∞)GYdF4y2Ba (1 -GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba) / 2GYdF4y2Ba
    “罗吉特”GYdF4y2Ba 物流GYdF4y2Ba (–∞,∞)GYdF4y2Ba 日志[1 + exp( -GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba)] / [2log(2)]GYdF4y2Ba
    “二次”GYdF4y2Ba 二次的GYdF4y2Ba [0,1]GYdF4y2Ba [1 -GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba(2GYdF4y2BasGYdF4y2BaJGYdF4y2Ba- 1))GYdF4y2Ba2.GYdF4y2Ba/ 2.GYdF4y2Ba

    该软件规范化二进制损耗,使得损耗为0.5GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba= 0。此外,软件计算每个类的平均二进制损失。GYdF4y2Ba

  • 对于自定义二进制损耗函数,例如,GYdF4y2Ba自定义函数GYdF4y2Ba,指定其功能句柄GYdF4y2BaBinaryLoss, @customFunctionGYdF4y2Ba.GYdF4y2Ba

    自定义函数GYdF4y2Ba你应该有这个表格GYdF4y2Ba

    bLoss=自定义函数(M,s)GYdF4y2Ba
    哪里:GYdF4y2Ba

    • MGYdF4y2Ba是个GYdF4y2BaKGYdF4y2Ba——- - - - - -GYdF4y2BaLGYdF4y2Ba存储在GYdF4y2Ba编码矩阵GYdF4y2Ba.GYdF4y2Ba

    • sGYdF4y2Ba是1-by-GYdF4y2BaLGYdF4y2Ba分类分数的行向量。GYdF4y2Ba

    • 布劳斯GYdF4y2Ba是分类损失。此标量将每个学习者的二进制损耗聚集在特定类中的每个学习者。例如,您可以使用平均二进制丢失来聚合每个类的学习者丢失。GYdF4y2Ba

    • KGYdF4y2Ba是班级的数量。GYdF4y2Ba

    • LGYdF4y2Ba是二元学习者的数量。GYdF4y2Ba

    有关传递自定义二进制损耗函数的示例,请参见GYdF4y2Ba使用自定义二进制损失函数预测ECOC模型的测试样本标签GYdF4y2Ba.GYdF4y2Ba

默认情况下,如果所有二进制学习者都是线性分类模型,使用:GYdF4y2Ba

  • 然后,SVMGYdF4y2Ba双星GYdF4y2Ba是GYdF4y2Ba'合页'GYdF4y2Ba

  • 逻辑回归,然后GYdF4y2Ba双星GYdF4y2Ba是GYdF4y2Ba“二次”GYdF4y2Ba

例子:GYdF4y2Ba“二进制丢失”,“二进制偏差”GYdF4y2Ba

数据类型:GYdF4y2Ba字符GYdF4y2Ba|GYdF4y2Ba字符串GYdF4y2Ba|GYdF4y2Ba功能手柄GYdF4y2Ba

聚合二进制损失的解码方案,指定为逗号分隔对,由GYdF4y2Ba“解码”GYdF4y2Ba和GYdF4y2Ba“迷失方向”GYdF4y2Ba或者GYdF4y2Ba“lossbased”GYdF4y2Ba.有关更多信息,请参阅GYdF4y2Ba二进制损失GYdF4y2Ba.GYdF4y2Ba

例子:GYdF4y2Ba'解码','丢失'GYdF4y2Ba

估计选项,指定为逗号分隔的对,由GYdF4y2Ba“选项”GYdF4y2Ba和返回的结构数组GYdF4y2BastatsetGYdF4y2Ba.GYdF4y2Ba

要调用并行计算:GYdF4y2Ba

  • 您需要一个并行计算工具箱™许可证。GYdF4y2Ba

  • 指定GYdF4y2Ba“选项”,statset (UseParallel,真的)GYdF4y2Ba.GYdF4y2Ba

详细程度,指定为逗号分隔对,由GYdF4y2Ba“详细”GYdF4y2Ba和GYdF4y2Ba0GYdF4y2Ba或者GYdF4y2Ba1.GYdF4y2Ba.GYdF4y2BaverbGYdF4y2Ba控制软件在命令窗口中显示的诊断消息的数量。GYdF4y2Ba

如果GYdF4y2BaverbGYdF4y2Ba是GYdF4y2Ba0GYdF4y2Ba,则该软件不会显示诊断消息。否则,软件将显示诊断消息。GYdF4y2Ba

例子:GYdF4y2Ba'verbose',1GYdF4y2Ba

数据类型:GYdF4y2Ba单身的GYdF4y2Ba|GYdF4y2Ba双GYdF4y2Ba

输出参数GYdF4y2Ba

全部展开GYdF4y2Ba

旨在GYdF4y2Ba分类边距GYdF4y2Ba,作为数字向量或矩阵返回。GYdF4y2Ba

MGYdF4y2Ba是GYdF4y2BaNGYdF4y2Ba——- - - - - -GYdF4y2BaLGYdF4y2Ba,在那里GYdF4y2BaNGYdF4y2Ba是中的观察数GYdF4y2BaXGYdF4y2Ba和GYdF4y2BaLGYdF4y2Ba正规化强度的数量在吗GYdF4y2BaMDL.GYdF4y2Ba(即,GYdF4y2Ba努梅尔(Mdl.Lambda)GYdF4y2Ba).GYdF4y2Ba

M(GYdF4y2Ba我GYdF4y2Ba,GYdF4y2BaJGYdF4y2Ba)GYdF4y2Ba是交叉验证的分类裕度的观察GYdF4y2Ba我GYdF4y2Ba使用由线性分类模型组成的ECOC型号,具有正则化强度GYdF4y2Ba兰姆达(GYdF4y2BaJGYdF4y2Ba)GYdF4y2Ba.GYdF4y2Ba

例子GYdF4y2Ba

全部展开GYdF4y2Ba

加载NLP数据集。GYdF4y2Ba

负载GYdF4y2BanlpdataGYdF4y2Ba

XGYdF4y2Ba是预测数据的稀疏矩阵,和GYdF4y2BaYGYdF4y2Ba是类标签的分类矢量。GYdF4y2Ba

为简单起见,请对中的所有观察使用“其他”标签GYdF4y2BaYGYdF4y2Ba那不是GYdF4y2Ba'金宝appsimulink'GYdF4y2Ba,GYdF4y2Ba'DSP'GYdF4y2Ba, 或者GYdF4y2Ba“通讯”GYdF4y2Ba.GYdF4y2Ba

y(〜(ismember(y,{GYdF4y2Ba'金宝appsimulink'GYdF4y2Ba,GYdF4y2Ba'DSP'GYdF4y2Ba,GYdF4y2Ba“通讯”GYdF4y2Ba}))) =GYdF4y2Ba'其他'GYdF4y2Ba;GYdF4y2Ba

交叉验证多类线性分类模型。GYdF4y2Ba

rng (1);GYdF4y2Ba%的再现性GYdF4y2Bacvmdl = fitcecoc(x,y,GYdF4y2Ba'学习者'GYdF4y2Ba,GYdF4y2Ba'线性'GYdF4y2Ba,GYdF4y2Ba“克罗斯瓦尔”GYdF4y2Ba,GYdF4y2Ba“开”GYdF4y2Ba);GYdF4y2Ba

CVMdlGYdF4y2Ba是一个GYdF4y2BaClassificationedAdearecoc.GYdF4y2Ba模型。默认情况下,该软件实现10倍交叉验证。属性可以改变折叠的数量GYdF4y2Ba“KFold”GYdF4y2Ba名称-值对参数。GYdF4y2Ba

估计GYdF4y2BaKGYdF4y2Ba-折叠边缘。GYdF4y2Ba

m = kfoldmargin(cvmdl);尺寸(m)GYdF4y2Ba
ans=GYdF4y2Ba1×2GYdF4y2Ba31572 1GYdF4y2Ba

MGYdF4y2Ba是一个31572×1的向量。GYdF4y2Ba米(j)GYdF4y2Ba是折叠式边缘的平均值进行观察GYdF4y2BaJGYdF4y2Ba.GYdF4y2Ba

画出GYdF4y2BaKGYdF4y2Ba- 使用箱图的边距。GYdF4y2Ba

图形箱线图(m);h=gca;h、 YLim=[-5];头衔(GYdF4y2Ba“交叉验证的利润分配”GYdF4y2Ba)GYdF4y2Ba

图中包含一个坐标轴。具有交叉验证边距的标题分布的轴包含7个类型的类型。GYdF4y2Ba

执行特征选择的一种方法是比较GYdF4y2BaKGYdF4y2Ba-从多个模型折算利润。单从这个标准来看,边缘越大的分类器越好。GYdF4y2Ba

加载NLP数据集。预处理数据,如GYdF4y2Ba估计k倍交叉验证裕度GYdF4y2Ba,并对预测器数据进行定位,使观察结果与列相对应。GYdF4y2Ba

负载GYdF4y2BanlpdataGYdF4y2Bay(〜(ismember(y,{GYdF4y2Ba'金宝appsimulink'GYdF4y2Ba,GYdF4y2Ba'DSP'GYdF4y2Ba,GYdF4y2Ba“通讯”GYdF4y2Ba}))) =GYdF4y2Ba'其他'GYdF4y2Ba; X=X′;GYdF4y2Ba

创建以下两个数据集:GYdF4y2Ba

  • ullx.GYdF4y2Ba包含所有预测。GYdF4y2Ba

  • partXGYdF4y2Ba包含随机选择的1/2的预测器。GYdF4y2Ba

rng (1);GYdF4y2Ba%的再现性GYdF4y2Bap =大小(X, 1);GYdF4y2Ba%预测数GYdF4y2BahalfPredIdx=randsample(p,ceil(0.5*p));fullX=X;partX=X(half-predidx,:);GYdF4y2Ba

创建一个线性分类模型模板,指定使用SpaRSA优化目标函数。GYdF4y2Ba

t = templateLinear (GYdF4y2Ba'求解'GYdF4y2Ba,GYdF4y2Ba“斯巴萨”GYdF4y2Ba);GYdF4y2Ba

交叉验证由二元线性分类模型组成的两个ECOC模型:一个使用所有预测器,另一个使用一半预测器。表示观察结果对应于列。GYdF4y2Ba

cvmdl = fitcecoc(fullx,y,GYdF4y2Ba“学习者”GYdF4y2BatGYdF4y2Ba“克罗斯瓦尔”GYdF4y2Ba,GYdF4y2Ba“开”GYdF4y2Ba,GYdF4y2Ba......GYdF4y2Ba“ObservationsIn”GYdF4y2Ba,GYdF4y2Ba“专栏”GYdF4y2Ba);PCVMdl = fitcecoc (partX YGYdF4y2Ba“学习者”GYdF4y2BatGYdF4y2Ba“克罗斯瓦尔”GYdF4y2Ba,GYdF4y2Ba“开”GYdF4y2Ba,GYdF4y2Ba......GYdF4y2Ba“ObservationsIn”GYdF4y2Ba,GYdF4y2Ba“专栏”GYdF4y2Ba);GYdF4y2Ba

CVMdlGYdF4y2Ba和GYdF4y2BaPCVMDL.GYdF4y2Ba是GYdF4y2BaClassificationedAdearecoc.GYdF4y2Ba楷模。GYdF4y2Ba

估计GYdF4y2BaKGYdF4y2Ba-每个分类器的折叠边距。画出它的分布GYdF4y2BaKGYdF4y2Ba-使用方框图折叠边距集。GYdF4y2Ba

全页边距=kfoldMargin(CVMdl);partMargins=kfoldMargin(PCVMdl);图形箱线图([fullMargins partMargins],GYdF4y2Ba“标签”GYdF4y2Ba,GYdF4y2Ba......GYdF4y2Ba{GYdF4y2Ba'所有预测因素'GYdF4y2Ba,GYdF4y2Ba“一半预测因素”GYdF4y2Ba});H = GCA;H.YLIM = [-1 1];标题(GYdF4y2Ba“交叉验证的利润分配”GYdF4y2Ba)GYdF4y2Ba

图中包含一个坐标轴。标题为“交叉验证边距分布”的轴包含14个字行对象。GYdF4y2Ba

分布的GYdF4y2BaKGYdF4y2Ba-fold margin的两个分类器是相似的。GYdF4y2Ba

为了确定一个良好的套索惩罚强度的线性分类模型,使用逻辑回归学习者,比较分布GYdF4y2BaKGYdF4y2Ba-折叠边缘。GYdF4y2Ba

加载NLP数据集。预处理数据,如GYdF4y2Ba使用k折边距的功能选择GYdF4y2Ba.GYdF4y2Ba

负载GYdF4y2BanlpdataGYdF4y2Bay(〜(ismember(y,{GYdF4y2Ba'金宝appsimulink'GYdF4y2Ba,GYdF4y2Ba'DSP'GYdF4y2Ba,GYdF4y2Ba“通讯”GYdF4y2Ba}))) =GYdF4y2Ba'其他'GYdF4y2Ba; X=X′;GYdF4y2Ba

创建一组11个对数间隔的正则化强度GYdF4y2Ba 1.GYdF4y2Ba 0GYdF4y2Ba -GYdF4y2Ba 8.GYdF4y2Ba 通过GYdF4y2Ba 1.GYdF4y2Ba 0GYdF4y2Ba 1.GYdF4y2Ba .GYdF4y2Ba

λ=对数空间(-8,1,11);GYdF4y2Ba

创建一个线性分类模型模板,该模板指定使用带套索惩罚的逻辑回归,使用每个正则化强度,使用SpaRSA优化目标函数,并将目标函数梯度上的公差降低到最小GYdF4y2Ba1 e-8GYdF4y2Ba.GYdF4y2Ba

t = templateLinear (GYdF4y2Ba'学习者'GYdF4y2Ba,GYdF4y2Ba“物流”GYdF4y2Ba,GYdF4y2Ba'求解'GYdF4y2Ba,GYdF4y2Ba“斯巴萨”GYdF4y2Ba,GYdF4y2Ba......GYdF4y2Ba“正规化”GYdF4y2Ba,GYdF4y2Ba'套索'GYdF4y2Ba,GYdF4y2Ba“拉姆达”GYdF4y2Ba,lambda,GYdF4y2Ba“GradientTolerance”GYdF4y2Ba1 e-8);GYdF4y2Ba

交叉验证一个由二元、线性分类模型组成的ECOC模型,使用5倍交叉验证GYdF4y2Ba

rng (10);GYdF4y2Ba%的再现性GYdF4y2Bacvmdl = fitcecoc(x,y,GYdF4y2Ba“学习者”GYdF4y2BatGYdF4y2Ba“ObservationsIn”GYdF4y2Ba,GYdF4y2Ba“专栏”GYdF4y2Ba,GYdF4y2Ba“KFold”GYdF4y2Ba5)GYdF4y2Ba
CVMdl=ClassificationPartitionedLinearECOC CrossValidatedModel:'LinearECOC'ResponseName:'Y'NumObservations:31572 KFold:5分区:[1x1 cvpartition]类名:[comm dsp simulink others]ScoreTransf金宝apporm:'none'属性、方法GYdF4y2Ba

CVMdlGYdF4y2Ba是一个GYdF4y2BaClassificationedAdearecoc.GYdF4y2Ba模型。GYdF4y2Ba

估计GYdF4y2BaKGYdF4y2Ba-每个正则化强度的折叠边距。Logistic回归的分数在[0,1]中。应用二次二进制损失。GYdF4y2Ba

m = kfoldMargin (CVMdlGYdF4y2Ba“BinaryLoss”GYdF4y2Ba,GYdF4y2Ba“二次”GYdF4y2Ba);尺寸(m)GYdF4y2Ba
ans=GYdF4y2Ba1×2GYdF4y2Ba31572 11GYdF4y2Ba

MGYdF4y2Ba是每次观察的31572×11的交叉验证边缘矩阵。列对应于正则化强度。GYdF4y2Ba

画出GYdF4y2BaKGYdF4y2Ba-每个正则化强度的折叠边距。GYdF4y2Ba

数字;Boxplot(m)ylabel(GYdF4y2Ba“交叉验证的利润”GYdF4y2Ba)Xlabel(GYdF4y2Ba'lambda indices'GYdF4y2Ba)GYdF4y2Ba

图中包含一个轴。轴包含77个类型为line的对象。GYdF4y2Ba

数的值GYdF4y2Ba兰姆达GYdF4y2Ba收益率同样高,分布中心低价差。更高的值GYdF4y2Ba兰姆达GYdF4y2Ba导致预测变量稀疏,这是一个良好的分类器质量。GYdF4y2Ba

选择刚好在保证金配送中心开始减少和价差开始增加之前发生的正则化强度。GYdF4y2Ba

Lambdafinal = lambda(5);GYdF4y2Ba

利用整个数据集训练由线性分类模型组成的ECOC模型,并指定正则化强度GYdF4y2Balambdafinal.GYdF4y2Ba.GYdF4y2Ba

t = templateLinear (GYdF4y2Ba'学习者'GYdF4y2Ba,GYdF4y2Ba“物流”GYdF4y2Ba,GYdF4y2Ba'求解'GYdF4y2Ba,GYdF4y2Ba“斯巴萨”GYdF4y2Ba,GYdF4y2Ba......GYdF4y2Ba“正规化”GYdF4y2Ba,GYdF4y2Ba'套索'GYdF4y2Ba,GYdF4y2Ba“拉姆达”GYdF4y2Ba,lambda(5),GYdF4y2Ba“GradientTolerance”GYdF4y2Ba,1e-8);MdlFinal=FITCECOCC(X,Y,GYdF4y2Ba“学习者”GYdF4y2BatGYdF4y2Ba“ObservationsIn”GYdF4y2Ba,GYdF4y2Ba“专栏”GYdF4y2Ba);GYdF4y2Ba

估算新观察的标签,通过GYdF4y2Bamdlfinal.GYdF4y2Ba和新数据到GYdF4y2Ba预测GYdF4y2Ba.GYdF4y2Ba

更多关于GYdF4y2Ba

全部展开GYdF4y2Ba

参考GYdF4y2Ba

[1] 奥尔温,E.,R。夏皮雷和Y。歌手。“将多类减少为二进制:保证金分类的统一方法。”GYdF4y2Ba机器学习研究杂志GYdF4y2Ba.卷。1,2000,pp。113-141。GYdF4y2Ba

[2] Escalera,S.,O. pujol和P. Radeva。“在三元纠错输出代码中解码过程。”GYdF4y2Ba关于模式分析和机器智能的IEEE交易GYdF4y2Ba.2010年第32卷第7期120-134页。GYdF4y2Ba

[3] Escalera,S.,O. Pujol和P. Radeva。“用于纠错输出代码稀疏设计的三元代码的可分离。”GYdF4y2Ba图案识别GYdF4y2Ba.2009年第30卷第3期285-297页。GYdF4y2Ba

扩展功能GYdF4y2Ba

R2016a中引入GYdF4y2Ba