主要内容

预测

预测高斯内核分类模型的标签

描述

例子

标签=预测(MDL.X返回矩阵或表中预测器数据的预测类标签向量X,基于二元高斯内核分类模型MDL.

例子

标签分数] =预测(MDL.X也退货分数分数对于这两个课程。

例子

全部收缩

使用二元核分类模型预测训练集标签,并显示分类结果的混淆矩阵。

加载电离层数据集。该数据集有34个预测器和351个雷达返回的二进制响应,或坏(“b”)或好('G')。

负载电离层

培训二进制内核分类模型,标识雷达返回是否坏(“b”)或好('G')。

RNG(“默认”再现性的百分比MDL = FITCKENEL(X,Y);

MDL.是一个ClassificationKernel模型。

预测训练集,或重新替换,标签。

标签=预测(Mdl X);

构建一个混淆矩阵。

ConfusionTrain = confusionchart (Y,标签);

图包含ConfusionMatrixChart类型的对象。

模型错误分配每个班级的一个雷达返回。

使用二元核分类模型预测测试集标签,并显示分类结果的混淆矩阵。

加载电离层数据集。该数据集有34个预测器和351个雷达返回的二进制响应,或坏(“b”)或好('G')。

负载电离层

将数据集划分为训练集和测试集。为测试集指定15%的抵抗度样本。

RNG(“默认”再现性的百分比分区= cvpartition(y,“坚持”, 0.15);trainingInds =培训(分区);培训集的%指数testInds =测试(分区);%测试集索引

使用培训集列出二元内核分类模型。良好做法是定义班级订单。

mdl = fitckernel(x(traininginds,:),y(trainingInds),'Classnames',{“b”'G'});

预测训练集标签和测试集标签。

LabelTrain =预测(MDL,X(TrainingInds,:));labeltest = predict(mdl,x(testinds,:));

构建训练集的混淆矩阵。

ConfusionTrain = confusionchart (Y (trainingInds), labelTrain);

图包含ConfusionMatrixChart类型的对象。

该模型仅为每个班级返回一个雷达返回。

为测试集构造一个混淆矩阵。

ConfusionTest = confusionchart (Y (testInds), labelTest);

图包含ConfusionMatrixChart类型的对象。

该模型将一个糟糕的雷达返回错误分类为一个好的回报,并且五个良好的雷达返回返回错误。

估计测试集的后验类概率,并通过绘制receiver operating characteristic (ROC)曲线确定模型的质量。核分类模型仅对logistic回归学习者返回后验概率。

加载电离层数据集。该数据集有34个预测器和351个雷达返回的二进制响应,或坏(“b”)或好('G')。

负载电离层

将数据集划分为训练集和测试集。为测试集指定30%坚持度样本。

RNG(“默认”再现性的百分比分区= cvpartition(y,“坚持”,0.30);trainingInds =培训(分区);培训集的%指数testInds =测试(分区);%测试集索引

培训二元内核分类模型。适合逻辑回归学习者。

mdl = fitckernel(x(traininginds,:),y(trainingInds),...'Classnames',{“b”'G'},'学习者'“物流”);

预测测试集的后验类别概率。

[〜,后部] =预测(MDL,x(测试,:));

因为MDL.有一个正规化强度,输出是一个两列两行的矩阵,等于测试集观察的数量。列包含后验概率Mdl.ClassNames(我)给出一个特殊的观察结果。

获得虚假和真正的阳性率,并估计曲线下的区域(AUC)。指定第二类是正类。

(玻璃钢,tpr, ~, auc) = perfcurve (Y (testInds)、后(:,2),Mdl.ClassNames (2));auc
AUC = 0.9042

AUC接近1,这表明该模型预测了标签良好。

绘制ROC曲线。

图;图(fpr,tpr) h = gca;h.XLim (1) = -0.1;h.YLim (2) = 1.1;包含('虚假阳性率')ylabel(“真阳性率”) 标题('roc曲线'

图包含轴对象。具有标题ROC曲线的轴对象包含类型线的对象。

输入参数

全部收缩

二值核分类模型,指定为ClassificationKernel模型对象。你可以创建一个ClassificationKernel模型对象使用Fitconnelel.

要分类的预测器数据,指定为数字矩阵或表。

每一排X对应于一个观察,并且每列对应于一个变量。

  • 对于数值矩阵:

    • 列中的变量X必须具有与培训的预测变量相同的顺序MDL.

    • 如果你训练有素MDL.使用表(例如,TBL.) 和TBL.然后包含所有数字预测器变量,然后X可以是一个数字矩阵。治疗数字预测因子TBL.作为培训期间的分类,通过使用来确定分类预测因子分类预算名称 - 值对参数Fitconnelel..如果TBL.包含异构预测变量(例如,数字和分类数据类型)和X是一个数值矩阵,那么预测抛出错误。

  • 对于表:

    • 预测不支持字符向量的单金宝app元格阵列以外的多色变量或单元格阵列。

    • 如果你训练有素MDL.使用表(例如,TBL.),然后是所有预测变量X必须具有与那些训练过的相同的变量名和数据类型MDL.(存储在mdl.predictornames.)。但是,列顺序X不需要对应的列顺序TBL..还,TBL.X可以包含额外的变量(响应变量、观察权重等),但是预测忽略了它们。

    • 如果你训练有素MDL.使用数字矩阵,然后是预测器名称mdl.predictornames.和相应的预测变量名X肯定是一样的。要在训练期间指定预测器名称,请参见预测的人名称 - 值对参数Fitconnelel..所有预测因子变量X必须是数值向量。X可以包含额外的变量(响应变量、观察权重等),但是预测忽略了它们。

数据类型:桌子|双倍的|

输出参数

全部收缩

预测类标签,作为分类或字符数组、逻辑或数字矩阵或字符向量的单元格数组返回。

标签n行,哪里n观察的次数在吗X,并具有与观察类类标签相同的数据类型(Y过去常训练MDL.(该软件将字符串数组视为字符向量的单元格数组。)

预测将观察结果分类为获得最高分数的类别。

分类的分数,回归n-by-2数字数组,在哪里n观察的次数在吗X评分(j是分类观察的分数成类jmdl.classnames.存储类的顺序。

如果mdl.learner.“物流”,则分类得分为后验概率。

更多关于

全部收缩

分类分

对于内核分类模型,RAW分类分对观察进行分类x,行向量,进入正类是由

f x T x β + b

  • T · 是一种对特征扩展的观察的变换。

  • β为估计的系数列向量。

  • b为估计的标量偏差。

对分类的原始分类分数x变成了否定类fx.该软件将观察结果分类,得出一个积极的分数。

如果内核分类模型由Logistic回归学习者组成,则该软件适用分对数的分数转换为原始分类分数(见scoretransform.)。

扩展功能

介绍了R2017b