主要内容

保证金

找到分类利润支持向量机(SVM)分类器金宝app

描述

=利润(SVMModel,资源描述,ResponseVarName)返回分类的利润率()训练支持向量机(SVM)分类器金宝appSVMModel使用示例数据表资源描述和类标签Tbl.ResponseVarName

作为一个数值向量返回相同的长度吗Y。软件估计每个条目使用训练SVM分类器SVMModel,相应的行X,真正的类标签Y

=利润(SVMModel,资源描述,Y)返回分类利润()训练SVM分类器SVMModel使用示例数据表资源描述和类标签Y

例子

=利润(SVMModel,X,Y)返回分类利润率SVMModel使用预测数据矩阵X和类标签Y

例子

全部折叠

加载电离层数据集。

负载电离层rng (1);%的再现性

一个支持向量机分类器训练。指定一个抵抗15%样品用于测试,规范数据,并指定‘g’是积极的类。

CVSVMModel = fitcsvm (X, Y,“坚持”,0.15,“类名”,{“b”,‘g’},“标准化”,真正的);CompactSVMModel = CVSVMModel.Trained {1};%提取训练,紧凑的分类器testInds =测试(CVSVMModel.Partition);%提取测试指标XTest = X (testInds:);欧美= Y (testInds:);

CVSVMModel是一个ClassificationPartitionedModel分类器。它包含属性训练有素的,这是一个1×1单元阵列举行CompactClassificationSVM软件使用训练集训练分类器。

估计测试样本分类的利润率。

m =利润率(CompactSVMModel XTest、欧美);米(20)
ans =11×13.5461 5.5941 4.9944 4.5609 -4.7963 5.5125 -2.8772 1.8669 9.4997 9.5030⋮

观察是观察到的真实类分数减去最大错误类分数在所有各自的班上成绩。分类器,产生相对较大的利润优先。

通过比较测试样本进行特征选择利润率从多个模型。完全基于这种比较,模型最高的利润率是最好的模型。

加载电离层数据集。

负载电离层rng (1);%的再现性

分区数据集分为训练集和测试集。指定一个抵抗15%样本进行测试。

分区= cvpartition (Y,“坚持”,0.15);testInds =测试(分区);%测试集的指标XTest = X (testInds:);欧美= Y (testInds:);

分区定义了数据集的分区。

定义这两个数据集:

  • fullX包含所有预测(0的删除列除外)。

  • partX包含过去的20预测。

fullX = X;partX = X (:, end-20:结束);

训练SVM分类器为每个预测集。指定分区定义。

FullCVSVMModel = fitcsvm (fullX Y“CVPartition”、分区);PartCVSVMModel = fitcsvm (partX Y“CVPartition”、分区);FCSVMModel = FullCVSVMModel.Trained {1};PCSVMModel = PartCVSVMModel.Trained {1};

FullCVSVMModelPartCVSVMModelClassificationPartitionedModel分类器。它们包含的属性训练有素的,这是一个1×1单元阵列举行CompactClassificationSVM软件使用训练集训练分类器。

估计每个分类器的测试样本的利润率。

fullM =利润率(FCSVMModel XTest、欧美);partM =利润率(PCSVMModel XTest (:, end-20:结束),次);n =大小(XTest, 1);p = (fullM < partM) / n
p = 0.2500

大约25%的利润率从完整的模型更少比用更少的预测模型。这一结果表明,模型训练所有的预测都是更好的。

输入参数

全部折叠

支持向量机分类模型,指定为一个ClassificationSVM模型对象或CompactClassificationSVM模型对象返回的fitcsvm紧凑的,分别。

样本数据用于训练模型,指定为一个表。每一行的资源描述对应于一个观察,每一列对应一个预测变量。可选地,资源描述响应变量可以包含额外的列和观察权重。资源描述必须包含所有的预测用于火车SVMModel。多列变量和细胞数组以外的细胞阵列的特征向量是不允许的。

如果资源描述包含响应变量用于火车SVMModel,那么你不需要指定ResponseVarNameY

如果你训练SVMModel使用样本数据包含在一个表中,然后输入数据保证金也必须在一个表中。

如果你设置“标准化”,真的fitcsvm当训练SVMModel,那么软件标准化预测的列数据使用中相应的方法SVMModel.Mu和标准偏差SVMModel.Sigma

数据类型:

预测数据,指定为一个数字矩阵。

每一行的X对应于一个观察(也称为一个实例或例子),和每一列对应一个变量(也称为一个特性)。变量的列X必须与变量相同训练吗SVMModel分类器。

的长度Y的行数X必须是相等的。

如果你设置“标准化”,真的fitcsvm训练SVMModel,那么软件标准化的列X使用相应的手段SVMModel.Mu和标准偏差SVMModel.Sigma

数据类型:|

响应变量名称,指定为一个变量的名字资源描述。如果资源描述包含响应变量用于火车SVMModel,那么你不需要指定ResponseVarName

如果您指定ResponseVarName作为一个角色,那么你必须这样做向量或字符串标量。例如,如果响应变量是存储为Tbl.Response,然后指定ResponseVarName作为“响应”。否则,软件将所有列资源描述,包括Tbl.Response预测因子。

响应变量必须分类,字符,或字符串数组,逻辑或数值向量,或单元阵列的特征向量。如果响应变量是一个字符数组,数组的每个元素都必须对应一行。

数据类型:字符|字符串

指定的类标签,分类,特点,或字符串数组,逻辑或数值向量,或单元阵列的特征向量。Y的数据类型必须相同吗SVMModel.ClassNames(软件对字符串数组作为细胞阵列特征向量)。

的长度Y必须等于中的行数资源描述的行数X

更多关于

全部折叠

分类的优势

边缘的加权平均值吗分类的利润率

之前的重量是类概率。如果你提供重量,那么该软件可实现他们各自的先验概率和类。软件使用重整权重计算加权平均数。

选择在多个分类器的一种方式,例如,进行特征选择,是选择收益最高的边缘的分类器。

分类保证金

分类保证金二进制分类,对每个观察,真正的类的分类得分之间的差异和分类评分错误类。

软件定义了二进制分类的分类边界

= 2 y f ( x )

x是一个观察。如果真正的标签x是积极的类,然后呢y是1,否则和1。f(x)是观察positive-class分类评分x。分类通常被定义为:=yf(x)

如果利润相同的规模,那么他们作为分类信心措施。在多个分类器,那些产生更大的利润更好。

分类分

的支持向量机分类分分类观测x签署了距离x决定边界从-∞,+∞。积极的分数表明,对于一个类x预计这个类。否则负分数表示。

积极类分类得分 f ( x ) 是训练SVM分类函数。 f ( x ) 也是数值预测响应吗x,或者预测的分数x到积极的类。

f ( x ) = j = 1 n α j y j G ( x j , x ) + b ,

在哪里 ( α 1 , , α n , b ) 是估计的支持向量机参数, G ( x j , x ) 是点积的预测值之间的空间吗x和支持向量,包括金宝app训练集和观察。消极类分类评分x,或者预测的分数x进入负类,-f(x)。

如果G(xj,x)=xjx(线性内核),然后比分功能降低

f ( x ) = ( x / 年代 ) β + b

年代是内核规模和β是安装的向量线性系数。

更多细节,请参阅了解支持向量机金宝app

算法

二元分类,软件定义了观察的保证金j,j,因为

j = 2 y j f ( x j ) ,

在哪里yj∊{1}f(xj)是预测评分的观察j积极的类。然而,j=yjf(xj)是常用的定义。

引用

[1]Christianini, N。,和J. C. Shawe-Taylor.介绍支持向量机和其他基于学习的方法金宝app。英国剑桥:剑桥大学出版社,2000年。

扩展功能

版本历史

介绍了R2014a