主要内容

边缘

为支持向量机分类器寻找分类边缘金宝app

描述

e=边缘(SVMModel资源描述ResponseVarName返回分类的优势e),用于支持向量机分金宝app类器SVMModel使用表中的预测数据资源描述和类标签资源描述。ResponseVarName

分类边缘(e)是表示加权平均值的标量值分类的利润率

e=边缘(SVMModel资源描述Y返回分类的优势e)的SVM分类器SVMModel使用表中的预测数据资源描述和类标签Y

例子

e=边缘(SVMModelXY返回的分类边缘SVMModel利用矩阵中的预测数据X和类标签Y

例子

e=边缘(___“重量”权重计算提供的观测权值的分类边权重使用前面语法中的任何输入参数。

例子

全部折叠

加载电离层数据集。

负载电离层rng (1);%的再现性

训练SVM分类器。指定15%的抵抗样品进行测试,将数据标准化,并指定‘g’是积极类。

CVSVMModel = fitcsvm (X, Y,“坚持”, 0.15,“类名”, {“b”‘g’},...“标准化”,真正的);CompactSVMModel = CVSVMModel.Trained {1};%提取训练过的紧凑分类器testInds =测试(CVSVMModel.Partition);%提取测试指标XTest = X (testInds:);欧美= Y (testInds:);

CVSVMModel是一个ClassificationPartitionedModel分类器。它包含属性训练有素的,这是一个1 × 1单元格数组CompactClassificationSVM软件使用训练集训练的分类器。

估计测试样本边缘。

e =边缘(CompactSVMModel XTest、欧美)
e = 5.0766

测试样本的边际均值约为5。

假设一个数据集中的观测数据是按顺序测量的,由于技术升级,最后的150个观测数据的质量更好。通过权衡质量更好的观察结果而不是其他的观察结果来整合这一进步。

加载电离层数据集。

负载电离层rng (1);%的再现性

定义一个权重向量,将质量较好的观测值乘以其他观测值的两倍。

n =大小(X, 1);的权重= [(n - 150 1); 2 * 1 (150 1)];

训练SVM分类器。指定称重方案和15%的耐受性样品进行测试。另外,标准化数据并指定它‘g’是积极类。

CVSVMModel = fitcsvm (X, Y,“重量”权重,“坚持”, 0.15,...“类名”, {“b”‘g’},“标准化”,真正的);CompactSVMModel = CVSVMModel.Trained {1};testInds =测试(CVSVMModel.Partition);%提取测试指标XTest = X (testInds:);欧美= Y (testInds:);wte =重量(testInds:);

CVSVMModel是一个培训ClassificationPartitionedModel分类器。它包含属性训练有素的,这是一个1 × 1单元格数组CompactClassificationSVM软件使用训练集训练的分类器。

利用加权方案估计测试样本的加权边缘。

e =边缘(CompactSVMModel XTest,欧美,“重量”wte)
e = 4.8341

测试样本的加权平均余量约为5。

通过比较多个模型的测试样本边缘进行特征选择。仅根据这个比较,具有最高边的分类器就是最好的分类器。

加载电离层数据集。

负载电离层rng (1);%的再现性

将数据集划分为训练集和测试集。指定15%的抵抗样品进行测试。

分区= cvpartition (Y,“坚持”, 0.15);testInds =测试(分区);%测试集索引XTest = X (testInds:);欧美= Y (testInds:);

分区定义数据集分区。

定义这两个数据集:

  • fullX包含所有预测器(删除的0列除外)。

  • partX包含最近20个预测因子。

fullX = X;partX = X (:, end-20:结束);

为每个预测集训练支持向量机分类器。指定分区定义。

FullCVSVMModel = fitcsvm (fullX Y“CVPartition”、分区);PartCVSVMModel = fitcsvm (partX Y“CVPartition”、分区);FCSVMModel = FullCVSVMModel.Trained {1};PCSVMModel = PartCVSVMModel.Trained {1};

FullCVSVMModelPartCVSVMModelClassificationPartitionedModel分类器。它们包含属性训练有素的,这是一个1 × 1单元格数组CompactClassificationSVM软件使用训练集训练的分类器。

估计每个分类器的测试样本边缘。

fullEdge =边缘(FCSVMModel XTest、欧美)
fullEdge = 2.8321
partEdge =边缘(PCSVMModel XTest (:, end-20:结束),欧美)
partEdge = 1.5541

在完整的数据集上训练的分类器的边缘更大,说明用所有的预测器训练的分类器更好。

输入参数

全部折叠

SVM分类模型,指定为ClassificationSVM模型对象或CompactClassificationSVM返回的模型对象fitcsvm紧凑的,分别。

样本数据,指定为表。每一行的资源描述对应一个观察值,每一列对应一个预测变量。可选地,资源描述可以包含响应变量和观察权值的附加列。资源描述必须包含所有用于训练的预测因子吗SVMModel.除了字符向量的单元格数组之外,不允许使用多列变量和单元格数组。

如果资源描述包含用于训练的响应变量SVMModel,则不需要指定ResponseVarNameY

如果你训练SVMModel使用表中包含的样例数据,然后输入数据边缘也必须在表中。

如果你设置“标准化”,真的fitcsvm当训练SVMModel,然后软件使用相应的方法对预测数据的列进行标准化SVMModel。μ和标准差SVMModel。σ

数据类型:表格

预测器数据,指定为数字矩阵。

每一行的X对应于一个观察(也称为实例或示例),每一列对应于一个变量(也称为特性)。列中的变量X必须和训练SVMModel分类器。

的长度Y和行数X必须是相等的。

如果你设置“标准化”,真的fitcsvm训练SVMModel,则软件将栏目标准化X使用相应的方法SVMModel。μ和标准差SVMModel。σ

数据类型:|

中的响应变量名,指定为变量名资源描述.如果资源描述包含用于训练的响应变量SVMModel,则不需要指定ResponseVarName

如果您指定ResponseVarName,则必须以字符向量或字符串标量的形式进行。例如,如果响应变量存储为资源描述。响应,然后指定ResponseVarName作为“响应”.否则,软件将对所有列进行处理资源描述,包括资源描述。响应预测因子。

响应变量必须是一个类别、字符或字符串数组、逻辑或数字向量,或字符向量的单元格数组。如果响应变量是一个字符数组,那么每个元素必须对应数组的一行。

数据类型:字符|字符串

类标签,指定为类别、字符或字符串数组、逻辑或数字向量或字符向量的单元格数组。Y必须与的数据类型相同SVMModel。一会(该软件将字符串数组视为字符向量的单元格数组。)

的长度Y必须等于行数资源描述或者行数X

中指定为数值向量或变量名的观测权值资源描述

如果您指定权重作为一个数字向量,然后是权重必须等于里面的行数X资源描述

如果您指定权重中的变量名资源描述,则必须以字符向量或字符串标量的形式进行。例如,如果权重存储为资源描述。W,然后指定权重作为' W '.否则,软件将对所有列进行处理资源描述,包括资源描述。W预测因子。

如果你提供重量,边缘计算加权分类的优势.该软件对每一行的观察结果进行加权X资源描述与相应的重量权重

例子:“重量”、“W”

数据类型:||字符|字符串

更多关于

全部折叠

分类的优势

边缘的加权平均值是多少分类的利润率

权重是先验类的概率。如果您提供权重,那么软件将其归一化,并将其与各自类中的先验概率相加。该软件使用重归一化的权重来计算加权平均值。

在多个分类器中进行选择的一种方法是,例如执行特征选择,选择产生最高边缘的分类器。

分类保证金

分类保证金二元分类是,对于每个观察,真实类的分类分数与虚假类的分类分数之间的差值。

软件将二元分类的分类裕度定义为

2 y f x

x是一个观察。如果真实的标签x那么,是积极类吗y为1,否则为-1。fx)为观察的阳性分类评分x.分类裕度一般定义为yfx

如果边际值在同一尺度上,则作为分类置信度的衡量标准。在众多分类公司中,那些利润率更高的公司表现更好。

分类分

的支持向量机分类分分类观测x符号距离是多少x到决策边界为-∞到+∞。一个班级的积极分数表明x预计会在那个班。而得分为负值则说明情况并非如此。

积极类分类得分 f x 为训练后的支持向量机分类函数。 f x 也是数值预测的响应吗x,或预测得分x进入积极类。

f x j 1 n α j y j G x j x + b

在哪里 α 1 ... α n b 为估计的支持向量机参数, G x j x 点积在预测器空间中吗x和支持向量,和包金宝app括训练集观测值。负类分类评分为x,或预测得分x属于负类的是-fx).

如果Gxjx) =xjx(线性核),则得分函数简化为

f x x / 年代 β + b

年代是内核规模和β为拟合线性系数的向量。

有关详细信息,请参见理解支持向量机金宝app

算法

对于二元分类,该软件定义了观察裕度jj,因为

j 2 y j f x j

在哪里yj∊{1}fxj)为观测的预测分数j积极向上的课程。然而,jyjfxj)通常用于定义页边距。

参考文献

克里斯汀尼尼,N。c。肖-泰勒。支持向量机和其他基于核的学习方法简介金宝app.英国剑桥:剑桥大学出版社,2000年。

扩展功能

介绍了R2014a