主要内容

保证金

分类利润率高斯内核分类模型

描述

例子

=利润(Mdl,X,Y)返回分类的利润率二进制的高斯核分类模型Mdl使用预测数据X和相应的类标签Y

=利润(Mdl,资源描述,ResponseVarName)返回内核训练分类器的分类的利润率Mdl使用预测数据表资源描述和类标签Tbl.ResponseVarName

=利润(Mdl,资源描述,Y)返回分类器的分类的利润率Mdl使用预测数据表资源描述和类标签向量Y

例子

全部折叠

加载电离层数据集。这个数据集有34个预测因子和351二进制响应雷达回报,要么坏(“b”)或好(‘g’)。

负载电离层

分区数据集分为训练集和测试集。指定一个30%抵抗测试集样本。

rng (“默认”)%的再现性分区= cvpartition (Y,“坚持”,0.30);trainingInds =培训(分区);%训练集的指标testInds =测试(分区);%测试集的指标

火车一个二进制内核使用训练集分类模型。

Mdl = fitckernel (X (trainingInds:), Y (trainingInds));

估计利润率训练集和测试集的利润率。

mTrain =利润率(Mdl X (trainingInds:), Y (trainingInds));太=利润率(Mdl X (testInds:), Y (testInds));

情节两组边缘使用盒子情节。

箱线图([mTrain;太]、[0(大小(mTrain, 1), 1);(大小(mt, 1), 1)),“标签”,{“训练集”,测试集的});标题(训练集和测试集的利润率)

图包含一个坐标轴对象。坐标轴对象标题训练集和测试集的利润包含14线类型的对象。

训练集的边缘分布位于高于边际分布的测试集。

通过比较测试集进行特征选择利润率从多个模型。仅仅根据这一标准,分类器与更大的利润率是更好的分类器。

加载电离层数据集。这个数据集有34个预测因子和351二进制响应雷达回报,要么坏(“b”)或好(‘g’)。

负载电离层

分区数据集分为训练集和测试集。指定一个15%抵抗测试集样本。

rng (“默认”)%的再现性分区= cvpartition (Y,“坚持”,0.15);trainingInds =培训(分区);%训练集的指标XTrain = X (trainingInds:);YTrain = Y (trainingInds);testInds =测试(分区);%测试集的指标XTest = X (testInds:);欧美= Y (testInds);

随机选择10%的预测变量。

p =大小(X, 2);%的预测数量idxPart = randsample (p,装天花板(0.1 * p));

火车两个二进制内核分类模型:一个使用所有的预测,以及使用了随机的10%。

Mdl = fitckernel (XTrain YTrain);PMdl = fitckernel (XTrain (:, idxPart) YTrain);

MdlPMdlClassificationKernel模型。

估计每个分类器的测试集的利润率。

fullMargins =利润率(Mdl XTest、欧美);partMargins =利润率(PMdl XTest (:, idxPart)、欧美);

情节保证金设置使用箱形图的分布。

箱线图([fullMargins partMargins),“标签”,{“所有预测”,“10%的预测”});标题(测试集的利润的)

图包含一个坐标轴对象。坐标轴对象标题测试集利润率包含14线类型的对象。

的边缘分布PMdl位于高于利润分配Mdl。因此,PMdl模型是更好的分类器。

输入参数

全部折叠

二进制内核分类模型,指定为一个ClassificationKernel模型对象。您可以创建一个ClassificationKernel模型对象使用fitckernel

预测数据,指定为一个n——- - - - - -p数字矩阵,n是观察和的数量吗p预测的数量用于火车Mdl

的长度Y和观察的数量X必须是相等的。

数据类型:|

指定的类标签,分类,特点,或字符串数组;逻辑或数值向量;或细胞的特征向量。

  • 的数据类型Y的数据类型必须相同吗Mdl.ClassNames(软件对字符串数组作为细胞阵列特征向量)。

  • 的不同的类Y必须是一个子集的Mdl.ClassNames

  • 如果Y每个元素是一个字符数组,那么必须对应一个数组的行。

  • 的长度Y必须等于观测的数量X资源描述

数据类型:分类|字符|字符串|逻辑|||细胞

样本数据用于训练模型,指定为一个表。每一行的资源描述对应于一个观察,每一列对应一个预测变量。可选地,资源描述响应变量可以包含额外的列和观察权重。资源描述必须包含所有的预测用于火车Mdl。多列变量和细胞数组以外的细胞阵列的特征向量是不允许的。

如果资源描述包含响应变量用于火车Mdl,那么你不需要指定ResponseVarNameY

如果你训练Mdl使用样本数据包含在一个表中,然后输入数据保证金也必须在一个表中。

响应变量名称,指定为一个变量的名字资源描述。如果资源描述包含响应变量用于火车Mdl,那么你不需要指定ResponseVarName

如果您指定ResponseVarName,那么你必须指定它作为特征向量或字符串标量。例如,如果响应变量是存储为Tbl.Y,然后指定ResponseVarName作为“Y”。否则,软件将所有列资源描述,包括Tbl.Y预测因子。

响应变量必须分类,字符,或字符串数组;一个逻辑或数值向量;或一个单元阵列的特征向量。如果响应变量是一个字符数组,数组的每个元素都必须对应一行。

数据类型:字符|字符串

输出参数

全部折叠

分类的利润率,作为一个返回n1数字列向量,n观察的数量吗X

更多关于

全部折叠

分类保证金

分类保证金二进制分类,对每个观察,真正的类的分类得分之间的差异和分类评分错误类。

软件定义了二进制分类的分类边界

= 2 y f ( x )

x是一个观察。如果真正的标签x是积极的类,然后呢y是1,否则和1。f(x)是观察positive-class分类评分x。分类通常被定义为:=yf(x)

如果利润相同的规模,那么他们作为分类信心措施。在多个分类器,那些产生更大的利润更好。

分类分

内核的分类模型,原始分类分分类的观察x一个行向量,到积极的类定义

f ( x ) = T ( x ) β + b

  • T ( · ) 是一个转换的观察特性的扩张。

  • β是估计的列向量的系数。

  • b估计是标量的偏见。

原始的分类分分类x负类f(x)。软件将观察分为类产生一个积极的分数。

如果内核分类模型由逻辑回归的学习者,那么软件应用分对数的分数转换原始分类得分(见ScoreTransform)。

扩展功能

介绍了R2017b