主要内容

预测

用判别分析分类模型预测标签

描述

标签=预测(MdlX返回表或矩阵中预测器数据的预测类标签向量X,基于训练好的判别分析分类模型Mdl

标签分数成本) =预测(MdlX返回:

  • 分类分数矩阵(分数)表示标签来自特定类别的可能性。对于判别分析,分数为后验概率

  • 一个矩阵的预期分类成本成本).对于每一个X,预测类标签对应于所有类中的最小预期分类成本。

输入参数

全部展开

判别分析分类模型,指定为分类判别式紧分类判别式返回的模型对象fitcdiscr

要分类的预测器数据,指定为数字矩阵或表。

每行X对应一个观察值,每列对应一个变量。中的所有预测变量X必须是数字向量。

  • 对于数值矩阵,组成矩阵列的变量X必须和训练的预测变量有相同的顺序吗Mdl

  • 一个表:

    • 预测除了字符向量的单元金宝app格数组外,不支持多列变量和单元格数组。

    • 如果你训练Mdl使用表(例如,资源描述),然后在X必须具有与那些训练过的相同的变量名和数据类型Mdl(存储在Mdl。PredictorNames).但是,的列顺序X不需要对应的列顺序资源描述资源描述X可以包含其他变量(响应变量、观察权重等),但预测忽略了它们。

    • 如果你训练Mdl使用数字矩阵,然后将预测值命名为Mdl。PredictorNames和相应的预测变量名X肯定是一样的。要在训练期间指定预测器名称,请参见PredictorNames的名称-值对参数fitcdiscrX可以包含其他变量(响应变量、观察权重等),但预测忽略了它们。

数据类型:表格|双重的|仅有一个的

输出参数

全部展开

预测类标签,作为类别或字符数组、逻辑或数字向量或字符向量的单元格数组返回。

标签

  • 与观察到的类标签的数据类型相同(Y),训练Mdl(该软件将字符串数组视为字符向量的单元格数组。)

  • 长度等于行数X

预测类后验概率,作为大小的数字矩阵返回N-借-KN是中的观察值(行)数X,K是类的数量(单位为)Mdl.ClassNames).得分(i,j)是观察到的后验概率吗X他是一流的jMdl.ClassNames

预期分类费用,返回为大小矩阵N-借-KN是中的观察值(行)数X,K是类的数量(单位为)Mdl.ClassNames).成本(i, j)对行进行分类的成本是多少属于X作为类jMdl.ClassNames

例子

全部展开

加载Fisher的iris数据集。确定样本大小。

负载fisheriris1) N =大小(量;

将数据划分为训练集和测试集。拿出10%的数据进行测试。

rng (1);%的再现性本量利= cvpartition (N,“坚持”, 0.1);idxTrn =培训(cvp);%训练集指标idxTest =测试(cvp);%测试集索引

将训练数据存储在一个表中。

tblTrn = array2table(量(idxTrn:));tblTrn。Y=species(idxTrn);

使用训练集和默认选项训练判别分析模型。

Mdl = fitcdiscr (tblTrn,“Y”);

预测测试集的标签。你训练Mdl使用数据表,但可以使用矩阵预测标签。

标签=预测(Mdl,meas(idxTest,:);

为测试集构造一个混淆矩阵。

confusionchart(物种(idxTest)、标签)

图中包含ConfusionMatrixChart类型的对象。

Mdl将测试集中的一个杂色虹膜误分类为virginica。

载入费雪的虹膜数据集。只考虑使用花瓣的长度和宽度进行训练。

负载fisheririsX =量(:,3:4);

使用整个数据集训练二次判别分析模型。

Mdl=fitcdiscr(X,物种,“歧视型”“二次”);

在观测的预测器空间中定义一个网格值。预测网格中每个实例的后验概率。

xMax = max (X);xMin = min (X);d = 0.01;[x1Grid, x2Grid] = meshgrid (xMin (1): d: xMax (1) xMin (2): d: xMax (2));[~,分数]=预测(Mdl [x1Grid (:), x2Grid (:)));Mdl.ClassNames
ans =3 x1细胞{'setosa'} {'versicolor'} {'virginica'}

分数是类后验概率矩阵。列对应于Mdl.ClassNames.例如,分数(j, 1)是观察到的后验概率吗j是鸢尾。

在网格中绘制每个观测的花色分类的后验概率,并绘制训练数据。

图;contourf (x1Grid x2Grid,重塑(分数(:,2),大小(x1Grid, 1),大小(x1Grid, 2)));h = colorbar;caxis ([0 1]);colormap喷气式飞机持有在…上gscatter (X (: 1) X(:, 2),物种,“麦基”的方式来+);轴线头衔(“花斑的后验概率”);持有

图中包含一个坐标轴。花色后验概率轴包含轮廓、直线等4个对象。这些物品代表着维珍卡。

后验概率区域暴露了决策边界的一部分。

更多关于

全部展开

扩展能力

介绍了R2011b