主要内容gydF4y2Ba

kfoldMargingydF4y2Ba

分类利润率观察中未使用培训gydF4y2Ba

描述gydF4y2Ba

例子gydF4y2Ba

米gydF4y2Ba= kfoldMargin (gydF4y2BaCVMdlgydF4y2Ba)gydF4y2Ba返回旨在gydF4y2Ba分类的利润率gydF4y2Ba获得的gydF4y2BaCVMdlgydF4y2Ba,这是一个旨在,纠错输出编码(ECOC)模型组成的线性分类模型。也就是说,每一个褶皱,gydF4y2BakfoldMargingydF4y2Ba估计分类利润率的观察,它伸出火车时使用其他观测。gydF4y2Ba

米gydF4y2Ba包含分类利润率中每一个正规化的力量组成的线性分类模型gydF4y2BaCVMdlgydF4y2Ba。gydF4y2Ba

例子gydF4y2Ba

米gydF4y2Ba= kfoldMargin (gydF4y2BaCVMdlgydF4y2Ba,gydF4y2Ba名称,值gydF4y2Ba)gydF4y2Ba使用指定的一个或多个额外的选项gydF4y2Ba名称,值gydF4y2Ba对参数。例如,指定一个解码方案或冗长的水平。gydF4y2Ba

输入参数gydF4y2Ba

全部展开gydF4y2Ba

旨在,ECOC模型组成的线性分类模型,指定为一个gydF4y2BaClassificationPartitionedLinearECOCgydF4y2Ba模型对象。您可以创建一个gydF4y2BaClassificationPartitionedLinearECOCgydF4y2Ba模型使用gydF4y2BafitcecocgydF4y2Ba和:gydF4y2Ba

  1. 交叉验证的指定任何一个名称-值对参数,例如,gydF4y2BaCrossValgydF4y2Ba

  2. 设置名称-值对的论点gydF4y2Ba学习者gydF4y2Ba来gydF4y2Ba“线性”gydF4y2Ba或返回的一个线性分类模型模板gydF4y2BatemplateLineargydF4y2Ba

获得的估计,kfoldMargin适用相同的数据用于旨在ECOC模型(gydF4y2BaXgydF4y2Ba和gydF4y2BaYgydF4y2Ba)。gydF4y2Ba

名称-值参数gydF4y2Ba

指定可选的双参数作为gydF4y2BaName1 = Value1,…,以=家gydF4y2Ba,在那里gydF4y2Ba的名字gydF4y2Ba参数名称和吗gydF4y2Ba价值gydF4y2Ba相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。gydF4y2Ba

R2021a之前,用逗号来分隔每一个名称和值,并附上gydF4y2Ba的名字gydF4y2Ba在报价。gydF4y2Ba

二进制学习者损失函数,指定为逗号分隔组成的gydF4y2Ba“BinaryLoss”gydF4y2Ba和一个内置的损失函数名或函数句柄。gydF4y2Ba

  • 此表包含内置函数的名称和描述gydF4y2BaygydF4y2BajgydF4y2Ba是为特定的二进制类标签的学习者(集合{1 1 0}),gydF4y2Ba年代gydF4y2BajgydF4y2Ba观察分数吗gydF4y2BajgydF4y2Ba,gydF4y2BaggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)是二进制损失公式。gydF4y2Ba

    价值gydF4y2Ba 描述gydF4y2Ba 分数域gydF4y2Ba ggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)gydF4y2Ba
    “binodeviance”gydF4y2Ba 二项异常gydF4y2Ba (-∞∞)gydF4y2Ba 日志(1 + exp (2gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
    “指数”gydF4y2Ba 指数gydF4y2Ba (-∞∞)gydF4y2Ba exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba)/ 2gydF4y2Ba
    “汉明”gydF4y2Ba 汉明gydF4y2Ba [0,1]或(-∞,∞)gydF4y2Ba [1 -符号(gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba)/ 2gydF4y2Ba
    “枢纽”gydF4y2Ba 铰链gydF4y2Ba (-∞∞)gydF4y2Ba 马克斯(0,1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba)/ 2gydF4y2Ba
    “线性”gydF4y2Ba 线性gydF4y2Ba (-∞∞)gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba)/ 2gydF4y2Ba
    分对数的gydF4y2Ba 物流gydF4y2Ba (-∞∞)gydF4y2Ba 日志[1 + exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
    “二次”gydF4y2Ba 二次gydF4y2Ba [0,1]gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba(2gydF4y2Ba年代gydF4y2BajgydF4y2Ba- 1))gydF4y2Ba2gydF4y2Ba/ 2gydF4y2Ba

    软件可实现二进制损失,损失是0.5时gydF4y2BaygydF4y2BajgydF4y2Ba= 0。此外,软件计算意味着对每个类的二进制损失。gydF4y2Ba

  • 为一个自定义的二进制损失函数,例如,gydF4y2BacustomFunctiongydF4y2Ba,为其指定一个函数处理gydF4y2BaBinaryLoss, @customFunctiongydF4y2Ba。gydF4y2Ba

    customFunctiongydF4y2Ba应该有这种形式gydF4y2Ba

    布劳斯= customFunction (M s)gydF4y2Ba
    地点:gydF4y2Ba

    • 米gydF4y2Ba是gydF4y2BaKgydF4y2Ba——- - - - - -gydF4y2BaBgydF4y2Ba编码矩阵存储在gydF4y2BaMdl.CodingMatrixgydF4y2Ba。gydF4y2Ba

    • 年代gydF4y2Ba是1 -gydF4y2BaBgydF4y2Ba行向量分类的分数。gydF4y2Ba

    • 布劳斯gydF4y2Ba是损失的分类。这个标量骨料二进制损失为每一个学习者在一个特定的类。例如,您可以使用意味着二进制损失总损失超过学习者对于每个类。gydF4y2Ba

    • KgydF4y2Ba类的数量。gydF4y2Ba

    • BgydF4y2Ba是二进制学习者的数量。gydF4y2Ba

    为通过一个自定义的二进制损失函数的一个例子,看看gydF4y2Ba预测ECOC模型的测试样本标签使用自定义二进制损失函数gydF4y2Ba。gydF4y2Ba

默认情况下,如果所有二进制学习者使用线性分类模型:gydF4y2Ba

  • 支持向量机,然后gydF4y2BaBinaryLossgydF4y2Ba是gydF4y2Ba“枢纽”gydF4y2Ba

  • 逻辑回归,然后gydF4y2BaBinaryLossgydF4y2Ba是gydF4y2Ba“二次”gydF4y2Ba

例子:gydF4y2Ba“BinaryLoss”、“binodeviance”gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba|gydF4y2Bafunction_handlegydF4y2Ba

解码方案,骨料二进制损失,指定为逗号分隔组成的gydF4y2Ba“解码”gydF4y2Ba和gydF4y2Ba“lossweighted”gydF4y2Ba或gydF4y2Ba“lossbased”gydF4y2Ba。有关更多信息,请参见gydF4y2Ba二元损失gydF4y2Ba。gydF4y2Ba

例子:gydF4y2Ba“解码”、“lossbased”gydF4y2Ba

估计选项,指定为逗号分隔组成的gydF4y2Ba“选项”gydF4y2Ba和一个结构数组返回gydF4y2BastatsetgydF4y2Ba。gydF4y2Ba

调用并行计算:gydF4y2Ba

  • 你需要一个并行计算工具箱™许可证。gydF4y2Ba

  • 指定gydF4y2Ba“选项”,statset (UseParallel,真的)gydF4y2Ba。gydF4y2Ba

冗长的层面上,指定为逗号分隔组成的gydF4y2Ba“详细”gydF4y2Ba和gydF4y2Ba0gydF4y2Ba或gydF4y2Ba1gydF4y2Ba。gydF4y2Ba详细的gydF4y2Ba控制软件的诊断消息数量显示在命令窗口。gydF4y2Ba

如果gydF4y2Ba详细的gydF4y2Ba是gydF4y2Ba0gydF4y2Ba,那么软件不显示诊断消息。否则,软件显示诊断消息。gydF4y2Ba

例子:gydF4y2Ba“详细”,1gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

输出参数gydF4y2Ba

全部展开gydF4y2Ba

旨在gydF4y2Ba分类的利润率gydF4y2Ba,返回一个数值向量或矩阵。gydF4y2Ba

米gydF4y2Ba是gydF4y2BangydF4y2Ba——- - - - - -gydF4y2BalgydF4y2Ba,在那里gydF4y2BangydF4y2Ba观察的数量吗gydF4y2BaXgydF4y2Ba和gydF4y2BalgydF4y2Ba正规化的数量优势在吗gydF4y2BaMdlgydF4y2Ba(即,gydF4y2Ba元素个数(Mdl.Lambda)gydF4y2Ba)。gydF4y2Ba

米(gydF4y2Ba我gydF4y2Ba,gydF4y2BajgydF4y2Ba)gydF4y2Ba旨在分类的观察吗gydF4y2Ba我gydF4y2Ba使用ECOC模型,由线性分类模型,正规化的力量gydF4y2BaMdl.Lambda (gydF4y2BajgydF4y2Ba)gydF4y2Ba。gydF4y2Ba

例子gydF4y2Ba

全部展开gydF4y2Ba

加载NLP数据集。gydF4y2Ba

负载gydF4y2BanlpdatagydF4y2Ba

XgydF4y2Ba是一个稀疏矩阵的预测数据,gydF4y2BaYgydF4y2Ba是一个分类向量类的标签。gydF4y2Ba

为简单起见,使用标签的别人的观察gydF4y2BaYgydF4y2Ba不gydF4y2Ba“金宝app模型”gydF4y2Ba,gydF4y2Ba“dsp”gydF4y2Ba,或gydF4y2Ba“通讯”gydF4y2Ba。gydF4y2Ba

Y (~ (ismember (Y, {gydF4y2Ba“金宝app模型”gydF4y2Ba,gydF4y2Ba“dsp”gydF4y2Ba,gydF4y2Ba“通讯”gydF4y2Ba})))=gydF4y2Ba“别人”gydF4y2Ba;gydF4y2Ba

旨在一个多级线性分类模型。gydF4y2Ba

rng (1);gydF4y2Ba%的再现性gydF4y2BaCVMdl = fitcecoc (X, Y,gydF4y2Ba“学习者”gydF4y2Ba,gydF4y2Ba“线性”gydF4y2Ba,gydF4y2Ba“CrossVal”gydF4y2Ba,gydF4y2Ba“上”gydF4y2Ba);gydF4y2Ba

CVMdlgydF4y2Ba是一个gydF4y2BaClassificationPartitionedLinearECOCgydF4y2Ba模型。默认情况下,该软件实现了10倍交叉验证。你可以改变折叠使用的数量gydF4y2Ba“KFold”gydF4y2Ba名称-值对的论点。gydF4y2Ba

估计gydF4y2BakgydF4y2Ba倍的利润。gydF4y2Ba

m = kfoldMargin (CVMdl);尺寸(米)gydF4y2Ba
ans =gydF4y2Ba1×2gydF4y2Ba31572年1gydF4y2Ba

米gydF4y2Ba是一个由- 1 31572 -向量。gydF4y2Ba米(j)gydF4y2Ba观察out-of-fold利润的平均值吗gydF4y2BajgydF4y2Ba。gydF4y2Ba

画出gydF4y2BakgydF4y2Ba使用盒子情节倍利润。gydF4y2Ba

图;箱线图(m);甘氨胆酸h =;h。Yl我米=[-5 5]; title(“旨在分配利润”gydF4y2Ba)gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题旨在分配利润包含7线类型的对象。gydF4y2Ba

进行特征选择的方法之一是比较gydF4y2BakgydF4y2Ba倍的利润来自多个模型。仅仅根据这一标准,分类器与更大的利润率是更好的分类器。gydF4y2Ba

加载NLP的数据集,数据的预处理gydF4y2Ba估计k-Fold交叉验证的利润率gydF4y2Ba,东方预测数据,以便观察对应列。gydF4y2Ba

负载gydF4y2BanlpdatagydF4y2BaY (~ (ismember (Y, {gydF4y2Ba“金宝app模型”gydF4y2Ba,gydF4y2Ba“dsp”gydF4y2Ba,gydF4y2Ba“通讯”gydF4y2Ba})))=gydF4y2Ba“别人”gydF4y2Ba;X = X ';gydF4y2Ba

创建这两个数据集:gydF4y2Ba

  • fullXgydF4y2Ba包含所有预测。gydF4y2Ba

  • partXgydF4y2Ba包含预测的半随机选取的。gydF4y2Ba

rng (1);gydF4y2Ba%的再现性gydF4y2Bap =大小(X, 1);gydF4y2Ba%的预测数量gydF4y2BahalfPredIdx = randsample (p,装天花板(0.5 * p));fullX = X;partX = X (halfPredIdx:);gydF4y2Ba

创建一个线性分类模型模板,指定使用SpaRSA优化目标函数。gydF4y2Ba

t = templateLinear (gydF4y2Ba“规划求解”gydF4y2Ba,gydF4y2Ba“sparsa”gydF4y2Ba);gydF4y2Ba

旨在两个ECOC模型组成的二进制,线性分类模型:一个使用所有的预测和使用预测的一半。表明,观察对应列。gydF4y2Ba

CVMdl = fitcecoc (fullX YgydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba“CrossVal”gydF4y2Ba,gydF4y2Ba“上”gydF4y2Ba,gydF4y2Ba…gydF4y2Ba“ObservationsIn”gydF4y2Ba,gydF4y2Ba“列”gydF4y2Ba);PCVMdl = fitcecoc (partX YgydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba“CrossVal”gydF4y2Ba,gydF4y2Ba“上”gydF4y2Ba,gydF4y2Ba…gydF4y2Ba“ObservationsIn”gydF4y2Ba,gydF4y2Ba“列”gydF4y2Ba);gydF4y2Ba

CVMdlgydF4y2Ba和gydF4y2BaPCVMdlgydF4y2Ba是gydF4y2BaClassificationPartitionedLinearECOCgydF4y2Ba模型。gydF4y2Ba

估计gydF4y2BakgydF4y2Ba为每个分类器倍利润。情节的分布gydF4y2BakgydF4y2Ba倍利润集使用盒子情节。gydF4y2Ba

fullMargins = kfoldMargin (CVMdl);partMargins = kfoldMargin (PCVMdl);图;箱线图([fullMargins partMargins),gydF4y2Ba“标签”gydF4y2Ba,gydF4y2Ba…gydF4y2Ba{gydF4y2Ba“所有预测”gydF4y2Ba,gydF4y2Ba“预测的一半”gydF4y2Ba});甘氨胆酸h =;h。Yl我米=[-1 1]; title(“旨在分配利润”gydF4y2Ba)gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题旨在分配利润包含14线类型的对象。gydF4y2Ba

的分布gydF4y2BakgydF4y2Ba倍利润的两个分类器是相似的。gydF4y2Ba

确定好lasso-penalty强度线性分类模型,使用逻辑回归的学习者,分布进行比较gydF4y2BakgydF4y2Ba倍的利润。gydF4y2Ba

加载NLP的数据集,数据的预处理gydF4y2Ba特征选择使用k-fold利润率gydF4y2Ba。gydF4y2Ba

负载gydF4y2BanlpdatagydF4y2BaY (~ (ismember (Y, {gydF4y2Ba“金宝app模型”gydF4y2Ba,gydF4y2Ba“dsp”gydF4y2Ba,gydF4y2Ba“通讯”gydF4y2Ba})))=gydF4y2Ba“别人”gydF4y2Ba;X = X ';gydF4y2Ba

创建一组11对数间隔正则化的优势gydF4y2Ba 1gydF4y2Ba 0gydF4y2Ba - - - - - -gydF4y2Ba 8gydF4y2Ba 通过gydF4y2Ba 1gydF4y2Ba 0gydF4y2Ba 1gydF4y2Ba 。gydF4y2Ba

λ= logspace (8 1 11);gydF4y2Ba

创建一个线性分类模型模板,指定使用逻辑回归和套索点球,使用每一种正则化的优势,使用SpaRSA优化目标函数,并减少目标函数的梯度的宽容gydF4y2Ba1 e-8gydF4y2Ba。gydF4y2Ba

t = templateLinear (gydF4y2Ba“学习者”gydF4y2Ba,gydF4y2Ba“物流”gydF4y2Ba,gydF4y2Ba“规划求解”gydF4y2Ba,gydF4y2Ba“sparsa”gydF4y2Ba,gydF4y2Ba…gydF4y2Ba“正规化”gydF4y2Ba,gydF4y2Ba“套索”gydF4y2Ba,gydF4y2Ba“λ”gydF4y2Baλ,gydF4y2Ba“GradientTolerance”gydF4y2Ba1 e-8);gydF4y2Ba

旨在ECOC模型组成的二进制,线性分类模型使用5倍交叉验证gydF4y2Ba

rng (10);gydF4y2Ba%的再现性gydF4y2BaCVMdl = fitcecoc (X, Y,gydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba“ObservationsIn”gydF4y2Ba,gydF4y2Ba“列”gydF4y2Ba,gydF4y2Ba“KFold”gydF4y2Ba5)gydF4y2Ba
CVMdl = ClassificationPartitionedLinearECOC CrossValidatedModel:“LinearECOC”ResponseName:“Y”NumObservations: 31572 KFold: 5分区:[1 x1 cvpartition]类名:[通讯dsp仿真软件别人]ScoreTransform:“没有一金宝app个”属性,方法gydF4y2Ba

CVMdlgydF4y2Ba是一个gydF4y2BaClassificationPartitionedLinearECOCgydF4y2Ba模型。gydF4y2Ba

估计gydF4y2BakgydF4y2Ba为每个正则化强度倍利润。逻辑回归的分数是在[0,1]。应用二次二元的损失。gydF4y2Ba

m = kfoldMargin (CVMdlgydF4y2Ba“BinaryLoss”gydF4y2Ba,gydF4y2Ba“二次”gydF4y2Ba);尺寸(米)gydF4y2Ba
ans =gydF4y2Ba1×2gydF4y2Ba31572年11gydF4y2Ba

米gydF4y2Ba是31572 - 11矩阵的每个观察旨在利润率。列对应的正则化优势。gydF4y2Ba

画出gydF4y2BakgydF4y2Ba为每个正则化强度倍利润。gydF4y2Ba

图;箱线图(m) ylabel (gydF4y2Ba“旨在利润率”gydF4y2Ba)包含(gydF4y2Ba“λ指数”gydF4y2Ba)gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象包含77行类型的对象。gydF4y2Ba

数的值gydF4y2BaλgydF4y2Ba收益率同样高的利润率较低的配送中心蔓延。更高的值gydF4y2BaλgydF4y2Ba导致预测变量较少,这是一个很好的分类器的质量。gydF4y2Ba

选择正则化强度发生之前配送中心开始下降幅度和传播开始增加。gydF4y2Ba

LambdaFinal =λ(5);gydF4y2Ba

火车一个ECOC模型组成的线性分类模型使用整个数据集和指定正则化的力量gydF4y2BaLambdaFinalgydF4y2Ba。gydF4y2Ba

t = templateLinear (gydF4y2Ba“学习者”gydF4y2Ba,gydF4y2Ba“物流”gydF4y2Ba,gydF4y2Ba“规划求解”gydF4y2Ba,gydF4y2Ba“sparsa”gydF4y2Ba,gydF4y2Ba…gydF4y2Ba“正规化”gydF4y2Ba,gydF4y2Ba“套索”gydF4y2Ba,gydF4y2Ba“λ”gydF4y2Baλ(5),gydF4y2Ba“GradientTolerance”gydF4y2Ba1 e-8);MdlFinal = fitcecoc (X, Y,gydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba“ObservationsIn”gydF4y2Ba,gydF4y2Ba“列”gydF4y2Ba);gydF4y2Ba

为新观测估计标签,通过gydF4y2BaMdlFinalgydF4y2Ba和新数据gydF4y2Ba预测gydF4y2Ba。gydF4y2Ba

更多关于gydF4y2Ba

全部展开gydF4y2Ba

引用gydF4y2Ba

[1]Allwein E。,R. Schapire, and Y. Singer. “Reducing multiclass to binary: A unifying approach for margin classifiers.”机器学习研究杂志》上gydF4y2Ba。1卷,2000年,页113 - 141。gydF4y2Ba

[2]Escalera, S。,O. Pujol, and P. Radeva. “Separability of ternary codes for sparse designs of error-correcting output codes.”Recog模式。列托人。gydF4y2Ba问题3,卷。30日,2009年,页285 - 297。gydF4y2Ba

[3]Escalera, S。,O. Pujol, and P. Radeva. “On the decoding process in ternary error-correcting output codes.”IEEE模式分析与机器智能gydF4y2Ba。32卷,问题7,2010年,页120 - 134。gydF4y2Ba

扩展功能gydF4y2Ba

版本历史gydF4y2Ba

介绍了R2016agydF4y2Ba