主要内容gydF4y2Ba

边缘gydF4y2Ba

多类纠错输出码(ECOC)模型的分类边缘gydF4y2Ba

描述gydF4y2Ba

egydF4y2Ba=边缘(gydF4y2BaMdlgydF4y2Ba,gydF4y2Ba资源描述gydF4y2Ba,gydF4y2BaResponseVarNamegydF4y2Ba)gydF4y2Ba返回gydF4y2Ba分类的优势gydF4y2Ba(gydF4y2BaegydF4y2Ba),用于训练多类纠错输出码(ECOC)分类器gydF4y2BaMdlgydF4y2Ba使用表中的预测数据gydF4y2Ba资源描述gydF4y2Ba和类标签gydF4y2Ba资源描述。ResponseVarNamegydF4y2Ba.gydF4y2Ba

egydF4y2Ba=边缘(gydF4y2BaMdlgydF4y2Ba,gydF4y2Ba资源描述gydF4y2Ba,gydF4y2BaYgydF4y2Ba)gydF4y2Ba返回分类器的分类边缘gydF4y2BaMdlgydF4y2Ba使用表中的预测数据gydF4y2Ba资源描述gydF4y2Ba以及vector中的类标签gydF4y2BaYgydF4y2Ba.gydF4y2Ba

例子gydF4y2Ba

egydF4y2Ba=边缘(gydF4y2BaMdlgydF4y2Ba,gydF4y2BaXgydF4y2Ba,gydF4y2BaYgydF4y2Ba)gydF4y2Ba返回分类边(gydF4y2BaegydF4y2Ba)用于分类器gydF4y2BaMdlgydF4y2Ba利用矩阵中的预测数据gydF4y2BaXgydF4y2Ba以及vector中的类标签gydF4y2BaYgydF4y2Ba.gydF4y2Ba

例子gydF4y2Ba

egydF4y2Ba=边缘(gydF4y2Ba___gydF4y2Ba,gydF4y2Ba名称,值gydF4y2Ba)gydF4y2Ba除了前面语法中的任何输入参数组合外,还使用一个或多个名称-值对参数指定选项。例如,您可以指定解码方案、二进制学习器丢失函数和详细级别。gydF4y2Ba

例子gydF4y2Ba

全部折叠gydF4y2Ba

使用支持向量机二分类器计算ECOC模型的测试样本分类边缘。gydF4y2Ba

载入费雪的虹膜数据集。指定预测器数据gydF4y2BaXgydF4y2Ba,响应数据gydF4y2BaYgydF4y2Ba,和班级的顺序gydF4y2BaYgydF4y2Ba.gydF4y2Ba

负载gydF4y2BafisheririsgydF4y2BaX =量;Y =分类(物种);classOrder =独特(Y);gydF4y2Ba%课堂秩序gydF4y2Barng (1);gydF4y2Ba%的再现性gydF4y2Ba

使用支持向量机二分类器训练ECOC模型。指定30%的拒绝样本进行测试,使用SVM模板标准化预测器,并指定类顺序。gydF4y2Ba

t = templateSVM (gydF4y2Ba“标准化”gydF4y2Ba,真正的);PMdl = fitcecoc (X, Y,gydF4y2Ba“坚持”gydF4y2Ba, 0.30,gydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba“类名”gydF4y2Ba, classOrder);Mdl = PMdl.Trained {1};gydF4y2Ba%提取训练过的紧凑分类器gydF4y2Ba

PMdlgydF4y2Ba是一个gydF4y2BaClassificationPartitionedECOCgydF4y2Ba模型。它有一个属性gydF4y2Ba训练有素的gydF4y2Ba,一个1 × 1单元数组,其中包含gydF4y2BaCompactClassificationECOCgydF4y2Ba使用训练数据建立软件训练的模型。gydF4y2Ba

计算测试样本边缘。gydF4y2Ba

testInds =测试(PMdl.Partition);gydF4y2Ba%提取测试指标gydF4y2BaXTest = X (testInds:);欧美= Y (testInds:);e =边缘(Mdl XTest、欧美)gydF4y2Ba
e = 0.4573gydF4y2Ba

样本边际值的平均值约为0.46。gydF4y2Ba

计算ECOC模型的测试样本加权边际值的平均值。gydF4y2Ba

假设一个数据集中的观测数据是按顺序测量的,由于技术升级,最后75个观测数据的质量更好。通过给予质量更好的观测值比其他观测值更大的权重来整合这一进步。gydF4y2Ba

载入费雪的虹膜数据集。指定预测器数据gydF4y2BaXgydF4y2Ba,响应数据gydF4y2BaYgydF4y2Ba,和班级的顺序gydF4y2BaYgydF4y2Ba.gydF4y2Ba

负载gydF4y2BafisheririsgydF4y2BaX =量;Y =分类(物种);classOrder =独特(Y);gydF4y2Ba%课堂秩序gydF4y2Barng (1);gydF4y2Ba%的再现性gydF4y2Ba

定义一个权重向量,为质量更好的观测值分配两倍的权重。gydF4y2Ba

n =大小(X, 1);的权重= [(n - 75 1); 2 * 1 (75 1)];gydF4y2Ba

使用支持向量机二分类器训练ECOC模型。指定30%的抵抗样品和加权方案。使用SVM模板标准化预测器,并指定类的顺序。gydF4y2Ba

t = templateSVM (gydF4y2Ba“标准化”gydF4y2Ba,真正的);PMdl = fitcecoc (X, Y,gydF4y2Ba“坚持”gydF4y2Ba, 0.30,gydF4y2Ba“重量”gydF4y2Ba权重,gydF4y2Ba...gydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba“类名”gydF4y2Ba, classOrder);Mdl = PMdl.Trained {1};gydF4y2Ba%提取训练过的紧凑分类器gydF4y2Ba

PMdlgydF4y2Ba是一个培训gydF4y2BaClassificationPartitionedECOCgydF4y2Ba模型。它有一个属性gydF4y2Ba训练有素的gydF4y2Ba,一个1 × 1单元数组,其中包含gydF4y2BaCompactClassificationECOCgydF4y2Ba软件使用训练数据训练的分类器。gydF4y2Ba

使用加权方案计算测试样本的加权边缘。gydF4y2Ba

testInds =测试(PMdl.Partition);gydF4y2Ba%提取测试指标gydF4y2BaXTest = X (testInds:);欧美= Y (testInds:);wte =重量(testInds:);e =边缘(Mdl XTest,欧美,gydF4y2Ba“重量”gydF4y2Bawte)gydF4y2Ba
e = 0.4798gydF4y2Ba

测试样本的平均加权裕度约为0.48。gydF4y2Ba

通过比较多个模型的测试样本边缘进行特征选择。仅根据这个比较,具有最大边的分类器就是最好的分类器。gydF4y2Ba

载入费雪的虹膜数据集。指定预测器数据gydF4y2BaXgydF4y2Ba,响应数据gydF4y2BaYgydF4y2Ba,和班级的顺序gydF4y2BaYgydF4y2Ba.gydF4y2Ba

负载gydF4y2BafisheririsgydF4y2BaX =量;Y =分类(物种);classOrder =独特(Y);gydF4y2Ba%课堂秩序gydF4y2Barng (1);gydF4y2Ba%的再现性gydF4y2Ba

将数据集划分为训练集和测试集。指定30%的抵抗样品进行测试。gydF4y2Ba

分区= cvpartition (Y,gydF4y2Ba“坚持”gydF4y2Ba, 0.30);testInds =测试(分区);gydF4y2Ba%测试集索引gydF4y2BaXTest = X (testInds:);欧美= Y (testInds:);gydF4y2Ba

分区gydF4y2Ba定义数据集分区。gydF4y2Ba

定义这两个数据集:gydF4y2Ba

  • fullXgydF4y2Ba包含所有预测。gydF4y2Ba

  • partXgydF4y2Ba只包含花瓣尺寸。gydF4y2Ba

fullX = X;partX = X (:, 3:4);gydF4y2Ba

使用支持向量机二分类器对每个预测器集训练ECOC模型。指定分区定义,使用SVM模板标准化预测器,并指定类顺序。gydF4y2Ba

t = templateSVM (gydF4y2Ba“标准化”gydF4y2Ba,真正的);fullPMdl = fitcecoc (fullX YgydF4y2Ba“CVPartition”gydF4y2Ba分区,gydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba...gydF4y2Ba“类名”gydF4y2Ba, classOrder);partPMdl = fitcecoc (partX YgydF4y2Ba“CVPartition”gydF4y2Ba分区,gydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba...gydF4y2Ba“类名”gydF4y2Ba, classOrder);fullMdl = fullPMdl.Trained {1};partMdl = partPMdl.Trained {1};gydF4y2Ba

fullPMdlgydF4y2Ba和gydF4y2BapartPMdlgydF4y2Ba是gydF4y2BaClassificationPartitionedECOCgydF4y2Ba模型。每个模型都有这个属性gydF4y2Ba训练有素的gydF4y2Ba,一个1 × 1单元数组,其中包含gydF4y2BaCompactClassificationECOCgydF4y2Ba模型表明软件使用相应的训练集进行训练。gydF4y2Ba

计算每个分类器的测试样本边缘。gydF4y2Ba

fullEdge =边缘(fullMdl XTest、欧美)gydF4y2Ba
fullEdge = 0.4573gydF4y2Ba
partEdge =边缘(partMdl XTest(:, 3:4)、欧美)gydF4y2Ba
partEdge = 0.4839gydF4y2Ba

partMdlgydF4y2Ba产生与更复杂模型的值相当的边缘值gydF4y2BafullMdlgydF4y2Ba.gydF4y2Ba

输入参数gydF4y2Ba

全部折叠gydF4y2Ba

全或紧凑的多级ECOC模型,指定为gydF4y2BaClassificationECOCgydF4y2Ba或gydF4y2BaCompactClassificationECOCgydF4y2Ba模型对象。gydF4y2Ba

要创建完整或紧凑的ECOC模型,请参见gydF4y2BaClassificationECOCgydF4y2Ba或gydF4y2BaCompactClassificationECOCgydF4y2Ba.gydF4y2Ba

样本数据,指定为表。每一行的gydF4y2Ba资源描述gydF4y2Ba对应一个观察值,每一列对应一个预测变量。可选地,gydF4y2Ba资源描述gydF4y2Ba可以包含响应变量和观察权值的附加列。gydF4y2Ba资源描述gydF4y2Ba必须包含所有用于训练的预测因子吗gydF4y2BaMdlgydF4y2Ba.除了字符向量的单元格数组之外,不允许使用多列变量和单元格数组。gydF4y2Ba

如果你训练gydF4y2BaMdlgydF4y2Ba示例数据包含在gydF4y2Ba表格gydF4y2Ba,然后输入数据gydF4y2Ba边缘gydF4y2Ba也必须在表中。gydF4y2Ba

当训练gydF4y2BaMdlgydF4y2Ba,假设你设置gydF4y2Ba“标准化”,真的gydF4y2Ba中指定的模板对象gydF4y2Ba“学习者”gydF4y2Ba的名称-值对参数gydF4y2BafitcecocgydF4y2Ba.在这种情况下,为相应的二进制学习者gydF4y2BajgydF4y2Ba,软件采用相应的方法对新预测数据的列进行标准化gydF4y2BaMdl.BinaryLearner {j} .MugydF4y2Ba的标准差gydF4y2BaMdl.BinaryLearner {j} .SigmagydF4y2Ba.gydF4y2Ba

数据类型:gydF4y2Ba表格gydF4y2Ba

中的响应变量名,指定为变量名gydF4y2Ba资源描述gydF4y2Ba.如果gydF4y2Ba资源描述gydF4y2Ba包含用于训练的响应变量gydF4y2BaMdlgydF4y2Ba,则不需要指定gydF4y2BaResponseVarNamegydF4y2Ba.gydF4y2Ba

如果您指定gydF4y2BaResponseVarNamegydF4y2Ba,则必须以字符向量或字符串标量的形式进行。例如,如果响应变量存储为gydF4y2Batbl.ygydF4y2Ba,然后指定gydF4y2BaResponseVarNamegydF4y2Ba作为gydF4y2Ba“y”gydF4y2Ba.否则,软件将对所有列进行处理gydF4y2Ba资源描述gydF4y2Ba,包括gydF4y2Batbl.ygydF4y2Ba预测因子。gydF4y2Ba

响应变量必须是一个类别、字符或字符串数组、逻辑或数字向量,或字符向量的单元格数组。如果响应变量是一个字符数组,那么每个元素必须对应数组的一行。gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba

预测器数据,指定为数字矩阵。gydF4y2Ba

每一行的gydF4y2BaXgydF4y2Ba对应一个观察值,每一列对应一个变量。列中的变量gydF4y2BaXgydF4y2Ba必须与训练分类器的变量相同吗gydF4y2BaMdlgydF4y2Ba.gydF4y2Ba

行数gydF4y2BaXgydF4y2Ba必须等于行数gydF4y2BaYgydF4y2Ba.gydF4y2Ba

当训练gydF4y2BaMdlgydF4y2Ba,假设你设置gydF4y2Ba“标准化”,真的gydF4y2Ba中指定的模板对象gydF4y2Ba“学习者”gydF4y2Ba的名称-值对参数gydF4y2BafitcecocgydF4y2Ba.在这种情况下,为相应的二进制学习者gydF4y2BajgydF4y2Ba,软件采用相应的方法对新预测数据的列进行标准化gydF4y2BaMdl.BinaryLearner {j} .MugydF4y2Ba的标准差gydF4y2BaMdl.BinaryLearner {j} .SigmagydF4y2Ba.gydF4y2Ba

数据类型:gydF4y2Ba双gydF4y2Ba|gydF4y2Ba单gydF4y2Ba

类标签,指定为类别、字符或字符串数组、逻辑或数字向量或字符向量的单元格数组。gydF4y2BaYgydF4y2Ba必须具有相同的数据类型gydF4y2BaMdl。一会gydF4y2Ba.gydF4y2Ba(该软件将字符串数组视为字符向量的单元格数组。)gydF4y2Ba

行数gydF4y2BaYgydF4y2Ba必须等于行数gydF4y2Ba资源描述gydF4y2Ba或gydF4y2BaXgydF4y2Ba.gydF4y2Ba

数据类型:gydF4y2Ba分类gydF4y2Ba|gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba|gydF4y2Ba逻辑gydF4y2Ba|gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba

名称-值参数gydF4y2Ba

指定可选的逗号分隔的对gydF4y2Ba名称,值gydF4y2Ba参数。gydF4y2Ba的名字gydF4y2Ba参数名和gydF4y2Ba价值gydF4y2Ba为对应值。gydF4y2Ba的名字gydF4y2Ba必须出现在引号内。可以以任意顺序指定多个名称和值对参数gydF4y2BaName1, Value1,…,的家gydF4y2Ba.gydF4y2Ba

例子:gydF4y2Ba边缘(Mdl, X, Y,“BinaryLoss”、“指数”,“解码”,“lossbased”)gydF4y2Ba指定一个指数型二进制学习损耗函数和一个基于损耗聚合二进制损耗的解码方案。gydF4y2Ba

二元学习器损失函数,指定为逗号分隔对,由gydF4y2Ba“BinaryLoss”gydF4y2Ba以及内置的损失函数名或函数句柄。gydF4y2Ba

  • 该表描述了内置函数,其中gydF4y2BaygydF4y2BajgydF4y2Ba是一个特定二元学习者的类标签(在集合{- 1,1,0}中),gydF4y2Ba年代gydF4y2BajgydF4y2Ba分数是否供观察gydF4y2BajgydF4y2Ba,gydF4y2BaggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)为二进制损耗公式。gydF4y2Ba

    价值gydF4y2Ba 描述gydF4y2Ba 分数域gydF4y2Ba ggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)gydF4y2Ba
    “binodeviance”gydF4y2Ba 二项异常gydF4y2Ba (-∞∞)gydF4y2Ba 日志(1 + exp (2gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
    “指数”gydF4y2Ba 指数gydF4y2Ba (-∞∞)gydF4y2Ba exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
    “汉明”gydF4y2Ba 汉明gydF4y2Ba [0, 1]或(-∞,∞)gydF4y2Ba [1 -符号(gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
    “枢纽”gydF4y2Ba 铰链gydF4y2Ba (-∞∞)gydF4y2Ba 马克斯(0,1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
    “线性”gydF4y2Ba 线性gydF4y2Ba (-∞∞)gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
    分对数的gydF4y2Ba 物流gydF4y2Ba (-∞∞)gydF4y2Ba 日志[1 + exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
    “二次”gydF4y2Ba 二次gydF4y2Ba [0, 1]gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba(2gydF4y2Ba年代gydF4y2BajgydF4y2Ba- 1))gydF4y2Ba2gydF4y2Ba/2gydF4y2Ba

    该软件使二进制损失正常化,因此损失是0.5时gydF4y2BaygydF4y2BajgydF4y2Ba= 0。此外,软件计算每个类的平均二进制损失。gydF4y2Ba

  • 例如,对于自定义二进制损耗函数gydF4y2BacustomFunctiongydF4y2Ba,指定其函数句柄gydF4y2BaBinaryLoss, @customFunctiongydF4y2Ba.gydF4y2Ba

    customFunctiongydF4y2Ba这种形式:gydF4y2Ba

    布劳斯= customFunction (M s)gydF4y2Ba
    地点:gydF4y2Ba

    • 米gydF4y2Ba是gydF4y2BaKgydF4y2Ba——- - - - - -gydF4y2BalgydF4y2Ba存储在gydF4y2BaMdl。CodingMatrixgydF4y2Ba.gydF4y2Ba

    • 年代gydF4y2Ba是1 -gydF4y2BalgydF4y2Ba分类分数的行向量。gydF4y2Ba

    • 布劳斯gydF4y2Ba是分类损失。这个标量集合了特定班级中每个学习者的二进制损失。例如,您可以使用平均二进制损失来汇总每个类的学习者的损失。gydF4y2Ba

    • KgydF4y2Ba为类数。gydF4y2Ba

    • lgydF4y2Ba是二元学习者的数量。gydF4y2Ba

    有关传递自定义二进制损耗函数的示例,请参见gydF4y2Ba用自定义二元损耗函数预测ECOC模型的试样标签gydF4y2Ba.gydF4y2Ba

默认的gydF4y2BaBinaryLossgydF4y2Ba值取决于二进制学习者返回的分数范围。该表描述了一些默认值gydF4y2BaBinaryLossgydF4y2Ba基于给定假设的值。gydF4y2Ba

假设gydF4y2Ba 默认值gydF4y2Ba
所有的二进制学习器都是支持向量机或支持向量机的线性或核分类模型。gydF4y2Ba “枢纽”gydF4y2Ba
所有的二元学习者都是由gydF4y2BaAdaboostM1gydF4y2Ba或gydF4y2BaGentleBoostgydF4y2Ba.gydF4y2Ba “指数”gydF4y2Ba
所有的二元学习者都是由gydF4y2BaLogitBoostgydF4y2Ba.gydF4y2Ba “binodeviance”gydF4y2Ba
所有二元学习者都是logistic回归学习者的线性或核分类模型。或者,你指定通过设置来预测类的后验概率gydF4y2Ba“FitPosterior”,真的gydF4y2Ba在gydF4y2BafitcecocgydF4y2Ba.gydF4y2Ba “二次”gydF4y2Ba

若要检查默认值,请使用点符号来显示gydF4y2BaBinaryLossgydF4y2Ba属性的训练模型在命令行。gydF4y2Ba

例子:gydF4y2Ba“BinaryLoss”、“binodeviance”gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba|gydF4y2Bafunction_handlegydF4y2Ba

聚合二进制损失的解码方案,指定为由。组成的逗号分隔对gydF4y2Ba“解码”gydF4y2Ba和gydF4y2Ba“lossweighted”gydF4y2Ba或gydF4y2Ba“lossbased”gydF4y2Ba.有关更多信息,请参见gydF4y2Ba二元损失gydF4y2Ba.gydF4y2Ba

例子:gydF4y2Ba“解码”、“lossbased”gydF4y2Ba

预测器数据观测维数,由指定的逗号分隔对组成gydF4y2Ba“ObservationsIn”gydF4y2Ba和gydF4y2Ba“列”gydF4y2Ba或gydF4y2Ba“行”gydF4y2Ba.gydF4y2BaMdl。BinaryLearnersgydF4y2Ba必须包含gydF4y2BaClassificationLineargydF4y2Ba模型。gydF4y2Ba

请注意gydF4y2Ba

如果您对预测器矩阵进行定位,使观察结果与列对应并指定gydF4y2Ba“ObservationsIn”、“列”gydF4y2Ba,可以显著减少执行时间。你不能指定gydF4y2Ba“ObservationsIn”、“列”gydF4y2Ba用于表中的预测器数据。gydF4y2Ba

估计选项,指定为逗号分隔的对,由gydF4y2Ba“选项”gydF4y2Ba和返回的结构数组gydF4y2BastatsetgydF4y2Ba.gydF4y2Ba

要调用并行计算:gydF4y2Ba

  • 您需要一个并行计算工具箱™许可证。gydF4y2Ba

  • 指定gydF4y2Ba“选项”,statset (UseParallel,真的)gydF4y2Ba.gydF4y2Ba

详细程度,指定为逗号分隔对,由gydF4y2Ba“详细”gydF4y2Ba和gydF4y2Ba0gydF4y2Ba或gydF4y2Ba1gydF4y2Ba.gydF4y2Ba详细的gydF4y2Ba控制软件在命令窗口中显示的诊断消息的数量。gydF4y2Ba

如果gydF4y2Ba详细的gydF4y2Ba是gydF4y2Ba0gydF4y2Ba,则该软件不会显示诊断消息。否则,软件将显示诊断消息。gydF4y2Ba

例子:gydF4y2Ba“详细”,1gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

观察权值,指定为逗号分隔的对,由gydF4y2Ba“重量”gydF4y2Ba和一个数字向量或变量的名称gydF4y2Ba资源描述gydF4y2Ba.如果你提供重量,gydF4y2Ba边缘gydF4y2Ba计算加权gydF4y2Ba分类的优势gydF4y2Ba.gydF4y2Ba

如果您指定gydF4y2Ba权重gydF4y2Ba作为一个数字向量,然后是gydF4y2Ba权重gydF4y2Ba必须等于观测的次数gydF4y2BaXgydF4y2Ba或gydF4y2Ba资源描述gydF4y2Ba.该软件可实现gydF4y2Ba权重gydF4y2Ba求和为各类的先验概率值。gydF4y2Ba

如果您指定gydF4y2Ba权重gydF4y2Ba中的变量名gydF4y2Ba资源描述gydF4y2Ba,则必须以字符向量或字符串标量的形式进行。例如,如果权重存储为gydF4y2Batbl.wgydF4y2Ba,然后指定gydF4y2Ba权重gydF4y2Ba作为gydF4y2Ba' w 'gydF4y2Ba.否则,软件将对所有列进行处理gydF4y2Ba资源描述gydF4y2Ba,包括gydF4y2Batbl.wgydF4y2Ba预测因子。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba

输出参数gydF4y2Ba

全部折叠gydF4y2Ba

分类的优势gydF4y2Ba,作为数字标量或向量返回。gydF4y2BaegydF4y2Ba的加权平均值gydF4y2Ba分类的利润率gydF4y2Ba.gydF4y2Ba

如果gydF4y2BaMdl。BinaryLearnersgydF4y2Ba包含gydF4y2BaClassificationLineargydF4y2Ba模型,然后gydF4y2BaegydF4y2Ba是1 -gydF4y2BalgydF4y2Ba向量,gydF4y2BalgydF4y2Ba为线性分类模型中正则化强度的个数(gydF4y2Ba元素个数(Mdl.BinaryLearners {1} .Lambda)gydF4y2Ba).的值gydF4y2Bae (j)gydF4y2Ba模型的边缘是使用正则化强度训练的吗gydF4y2BaMdl.BinaryLearners {1} .Lambda (j)gydF4y2Ba.gydF4y2Ba

否则,gydF4y2BaegydF4y2Ba为标量值。gydF4y2Ba

更多关于gydF4y2Ba

全部折叠gydF4y2Ba

分类的优势gydF4y2Ba

的gydF4y2Ba分类的优势gydF4y2Ba为分类边界的加权平均值。gydF4y2Ba

在多个分类器中进行选择的一种方法是选择产生最大边的分类器,例如执行特征选择。gydF4y2Ba

分类保证金gydF4y2Ba

的gydF4y2Ba分类保证金gydF4y2Ba为每次观察真实类的负损失与假类中最大负损失的差值。如果边际值在同一尺度上,则作为分类置信度的衡量标准。在众多分类公司中,那些利润率更高的公司表现更好。gydF4y2Ba

二元损失gydF4y2Ba

一个gydF4y2Ba二元损失gydF4y2Ba是类和分类分数的函数,它决定二元学习者如何将观察结果分类到类中。gydF4y2Ba

假设如下:gydF4y2Ba

  • 米gydF4y2BakjgydF4y2Ba是元素(gydF4y2BakgydF4y2Ba,gydF4y2BajgydF4y2Ba)的编码设计矩阵gydF4y2Ba米gydF4y2Ba(即与类对应的代码gydF4y2BakgydF4y2Ba二进制的学习者gydF4y2BajgydF4y2Ba).gydF4y2Ba

  • 年代gydF4y2BajgydF4y2Ba二元学习者的分数是多少gydF4y2BajgydF4y2Ba对于一个观察。gydF4y2Ba

  • ggydF4y2Ba为二进制损失函数。gydF4y2Ba

  • kgydF4y2Ba ^gydF4y2Ba 是观测的预测类。gydF4y2Ba

在gydF4y2Ba通过解码gydF4y2Ba(Escalera等。)gydF4y2Ba,对二进制学习者产生最小二进制损失和的类决定了观测的预测类,即,gydF4y2Ba

kgydF4y2Ba ^gydF4y2Ba =gydF4y2Ba argmingydF4y2Ba kgydF4y2Ba ∑gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba |gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba |gydF4y2Ba ggydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba jgydF4y2Ba )gydF4y2Ba .gydF4y2Ba

在gydF4y2Baloss-weighted解码gydF4y2Ba(Escalera等。)gydF4y2Ba,在二进制学习者上产生二进制损失最小平均的班级决定了观测的预测班级,即,gydF4y2Ba

kgydF4y2Ba ^gydF4y2Ba =gydF4y2Ba argmingydF4y2Ba kgydF4y2Ba ∑gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba |gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba |gydF4y2Ba ggydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba jgydF4y2Ba )gydF4y2Ba ∑gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba lgydF4y2Ba |gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba |gydF4y2Ba .gydF4y2Ba

Allwein et al。gydF4y2Ba提出损耗加权译码通过将所有类的损耗值保持在相同的动态范围内来提高分类精度。gydF4y2Ba

该表总结了支持的损耗函数,其中金宝appgydF4y2BaygydF4y2BajgydF4y2Ba是一个特定二元学习者的类标签(在集合{- 1,1,0}中),gydF4y2Ba年代gydF4y2BajgydF4y2Ba分数是否供观察gydF4y2BajgydF4y2Ba,gydF4y2BaggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba).gydF4y2Ba

价值gydF4y2Ba 描述gydF4y2Ba 分数域gydF4y2Ba ggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)gydF4y2Ba
“binodeviance”gydF4y2Ba 二项异常gydF4y2Ba (-∞∞)gydF4y2Ba 日志(1 + exp (2gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
“指数”gydF4y2Ba 指数gydF4y2Ba (-∞∞)gydF4y2Ba exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
“汉明”gydF4y2Ba 汉明gydF4y2Ba [0, 1]或(-∞,∞)gydF4y2Ba [1 -符号(gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
“枢纽”gydF4y2Ba 铰链gydF4y2Ba (-∞∞)gydF4y2Ba 马克斯(0,1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
“线性”gydF4y2Ba 线性gydF4y2Ba (-∞∞)gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
分对数的gydF4y2Ba 物流gydF4y2Ba (-∞∞)gydF4y2Ba 日志[1 + exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
“二次”gydF4y2Ba 二次gydF4y2Ba [0, 1]gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba(2gydF4y2Ba年代gydF4y2BajgydF4y2Ba- 1))gydF4y2Ba2gydF4y2Ba/2gydF4y2Ba

该软件使二进制损失正常化,当损失是0.5gydF4y2BaygydF4y2BajgydF4y2Ba= 0,并使用二进制学习者的平均值进行聚合gydF4y2Ba(Allwein等。)gydF4y2Ba.gydF4y2Ba

不要将二进制损失与总体分类损失(由gydF4y2Ba“LossFun”gydF4y2Ba的名称-值对参数gydF4y2Ba损失gydF4y2Ba和gydF4y2Ba预测gydF4y2Ba对象函数),它衡量ECOC分类器作为一个整体的执行情况。gydF4y2Ba

提示gydF4y2Ba

  • 为了比较多个ECOC分类器的边缘或边缘,在训练过程中使用模板对象指定分类器之间的公共分数转换函数。gydF4y2Ba

参考文献gydF4y2Ba

艾尔温,E.夏皮尔,Y.辛格。《将多类减少为二进制:一种统一的保证金分类方法》。gydF4y2Ba机器学习研究杂志gydF4y2Ba.2000年第1卷,113-141页。gydF4y2Ba

Pujol, S. Escalera, S. O. Pujol, P. Radeva。《论三元纠错输出码的译码过程》。gydF4y2Ba模式分析与机器智能学报gydF4y2Ba.2010年第32卷第7期120-134页。gydF4y2Ba

Pujol, S. Escalera, S. O. Pujol, P. Radeva。用于纠错输出码稀疏设计的三元码的可分性。gydF4y2Ba模式RecogngydF4y2Ba.2009年第30卷第3期285-297页。gydF4y2Ba

扩展功能gydF4y2Ba

介绍了R2014bgydF4y2Ba