主要内容

预测

高斯核分类模型的标签预测

描述

例子

标签=预测(MdlX返回矩阵或表中预测器数据的预测类标签的向量X,基于二进制高斯核分类模型Mdl

例子

标签分数预测,预测MdlX同样的回报分类的分数对于两个类。

例子

全部折叠

使用二进制核分类模型预测训练集标签,并显示结果分类的混淆矩阵。

加载电离层数据集。该数据集有34个预测器和351个雷达返回的二进制响应,要么是坏的(“b”)或好(‘g’).

负载电离层

训练一个二进制内核分类模型,识别雷达返回是否坏(“b”)或好(‘g’).

rng (“默认”%用于再现性Mdl = fitckernel(X,Y);

Mdl是一个ClassificationKernel模型。

预测训练集,或重新替换,标签。

label = predict(Mdl,X);

构造一个混淆矩阵。

confusitrain = confusichart (Y,label);

图包含一个confusimatrixchart类型的对象。

该模型对每一类的雷达回波进行了错误分类。

使用二进制内核分类模型预测测试集标签,并显示结果分类的混淆矩阵。

加载电离层数据集。该数据集有34个预测器和351个雷达返回的二进制响应,要么是坏的(“b”)或好(‘g’).

负载电离层

将数据集划分为训练集和测试集。为测试集指定15%的保留样本。

rng (“默认”%用于再现性分区= cvpartition(Y,“坚持”, 0.15);trainingInds =训练(分区);%训练集的指数testInds = test(分区);%测试集的索引

使用训练集训练一个二进制核分类模型。一个好的实践是定义类的顺序。

Mdl = fitckernel(X(trainingInds,:),Y(trainingInds),“类名”, {“b”‘g’});

预测训练集标签和测试集标签。

labelTrain = predict(Mdl,X(trainingInds,:));labelTest =预测(Mdl,X(testInds,:));

为训练集构造一个混淆矩阵。

confusitrain = confusichart (Y(trainingInds),labelTrain);

图包含一个confusimatrixchart类型的对象。

该模型对每个类别只错分类了一个雷达数据。

为测试集构造一个混淆矩阵。

confusitest = confusichart (Y(testInds),labelTest);

图包含一个confusimatrixchart类型的对象。

该模型错误地将一个糟糕的雷达回报分类为良好的回报,将五个良好的雷达回报分类为糟糕的回报。

估计一个测试集的后验类概率,并通过绘制接收者工作特征(ROC)曲线来确定模型的质量。核分类模型只返回逻辑回归学习者的后验概率。

加载电离层数据集。该数据集有34个预测器和351个雷达返回的二进制响应,要么是坏的(“b”)或好(‘g’).

负载电离层

将数据集划分为训练集和测试集。为测试集指定30%的保留样本。

rng (“默认”%用于再现性分区= cvpartition(Y,“坚持”, 0.30);trainingInds =训练(分区);%训练集的指数testInds = test(分区);%测试集的索引

训练一个二进制核分类模型。拟合逻辑回归学习者。

Mdl = fitckernel(X(trainingInds,:),Y(trainingInds),...“类名”, {“b”‘g’},“学习者”“物流”);

预测测试集的后验类概率。

[~,posterior] = predict(Mdl,X(testInds,:));

因为Mdl有一个正则化强度,输出是一个矩阵,有两列和两行,等于测试集观察值的数量。列包含后验概率Mdl.ClassNames(我)给定一个特定的观察结果。

计算ROC曲线的性能指标(真阳性率和假阳性率),并通过创建的方法找到ROC曲线下的面积(AUC)值rocmetrics对象。

rocObj = rocmetrics(Y(testInds),后部,Mdl.ClassNames);

绘制第二类的ROC曲线情节的函数rocmetrics

情节(rocObj一会= Mdl.ClassNames (2))

图中包含一个轴对象。标题为ROC Curve的坐标轴对象包含3个ROC曲线、散点、直线类型的对象。这些对象表示g (AUC = 0.9042), g模型工作点。

AUC接近1,这表明该模型很好地预测了标签。

输入参数

全部折叠

二进制内核分类模型,指定为ClassificationKernel模型对象。您可以创建ClassificationKernel使用模型对象fitckernel

要分类的预测器数据,指定为数字矩阵或表格。

每行X对应一个观察结果,每一列对应一个变量。

  • 对于数值矩阵:

    • 列中的变量X必须与训练的预测变量有相同的顺序Mdl

    • 如果你受过训练Mdl使用表格(例如,资源描述),资源描述那么,包含所有数值预测变量X可以是数值矩阵。处理中的数值预测器资源描述作为分类的训练,识别分类预测因子使用CategoricalPredictors的名称-值对参数fitckernel.如果资源描述包含异构预测变量(例如,数字和分类数据类型)和X是数字矩阵吗预测抛出错误。

  • 对于表格:

    • 预测不支持多列变量或除金宝app字符向量的单元格数组外的单元格数组。

    • 如果你受过训练Mdl使用表格(例如,资源描述),然后输入所有预测变量X必须具有与训练时相同的变量名称和数据类型Mdl(存储在Mdl。PredictorNames).的列序X是否需要对应的列顺序资源描述.同时,资源描述而且X可以包含额外的变量(响应变量、观察权重等),但是预测忽略了它们。

    • 如果你受过训练Mdl使用一个数字矩阵,然后预测器名称在Mdl。PredictorNames和相应的预测变量名X一定是一样的。若要在训练期间指定预测器名称,请参阅PredictorNames的名称-值对参数fitckernel.所有预测变量X必须是数值向量。X可以包含额外的变量(响应变量、观察权重等),但是预测忽略了它们。

数据类型:表格||

输出参数

全部折叠

预测类标签,返回为类别或字符数组、逻辑或数字矩阵或字符向量的单元格数组。

标签n行,n观察的数量在吗X,并且与观察到的类标签(Y)用来训练Mdl(该软件将字符串数组视为字符向量的单元格数组。)

预测函数将观察结果划分为得分最高的类别。为了观察分数,该函数将观察结果划分为多数类,这在训练标签中所占的比例最大。

分类的分数,作为n-by-2数值数组n观察的数量在吗X评分(j这是观察分类的分数吗成类jMdl。一会存储类的顺序。

如果Mdl。学习者“物流”,则分类分数为后验概率。

更多关于

全部折叠

分类分

对于内核分类模型,原始的分类分对观测进行分类x,一个行向量,转化为正类定义为

f x T x β + b

  • T · 是一种用于特征扩展的观察的转换。

  • β是系数的估计列向量。

  • b是估计的标量偏差。

用于分类的原始分类分数x进入否定类是fx.该软件将观察结果划分为产生正分的类别。

如果内核分类模型由逻辑回归学习器组成,则软件应用逻辑回归学习器分对数的分数转换为原始分类分数(见ScoreTransform).

扩展功能

版本历史

在R2017b中引入