主要内容

再沉积

再置换分类边缘

    描述

    实例

    E=重新沉积(Mdl)返回加权的重新替换分类边(E)的训练分类模型Mdl使用存储在Mdl.X中存储的相应的真正类标签Mdl.Y,存储的观测权值Mdl.W

    实例

    E=重新沉积(Mdl“IncludeInteractions”,包容互动)指定是否在计算中包含交互项。此语法仅适用于广义相加模型。

    例子

    全部折叠

    加载电离层数据集。这个数据集有34个预测器和351个雷达回波的二进制响应,或者是坏的(“b”)或好(‘g’).

    负载电离层

    训练支持向量机分金宝app类器。将数据标准化并指定‘g’是积极类。

    SVMModel=fitcsvm(X,Y,“标准化”符合事实的“类名”, {“b”,‘g’});

    SVMModel他是一个训练有素的人ClassificationSVM分类器。

    估计再替换边,即训练样本边缘的均值。

    e = resubEdge (SVMModel)
    e = 5.0999

    分类器边缘测量分类器边缘的平均值。进行特征选择的一种方法是比较来自多个模型的训练样本边缘。仅根据这个准则,具有最高边的分类器就是最好的分类器。

    加载电离层数据集。删除前两个预测稳定性的指标。

    负载电离层X=X(:,3:end);

    定义这两个数据集:

    • 富克斯包含所有预测。

    • partX包含10个最重要的预测值。

    fullX=X;idx=fscmrmr(X,Y);partX=X(:,idx(1:10));

    为每个预测器集训练朴素贝叶斯分类器。

    FullMdl=fitcnb(fullX,Y);PartMdl=fitcnb(partX,Y);

    FullMdlPartMdl受过训练分类朴素贝叶斯分类器。

    估计每个分类器的训练样本边缘。

    fullEdge = resubEdge (FullMdl)
    fullEdge = 0.6554
    partEdge = resubEdge (PartMdl)
    partEdge = 0.7796

    在10个最重要的预测因子上训练的分类器边缘较大。这一结果表明,仅使用这些预测因子训练的分类器具有更好的样本拟合。

    通过检验训练样本边缘和边缘,将具有线性项的广义可加模型与具有线性项和交互项的广义可加模型进行比较。仅从这一比较来看,具有最高边缘和边缘的分类器是最好的模型。

    加载存储在中的1994年人口普查数据census1994.mat该数据集由美国人口普查局的人口统计数据组成,用于预测个人年收入是否超过5万美元。该分类任务是根据年龄、工人阶级、教育水平、婚姻状况、种族等因素,拟合一个预测工资类别的模型。

    负载普查1994

    普查1994包含训练数据集adultdata以及测试数据集成人.为了减少本例的运行时间,从adultdata通过使用数据样本作用

    rng (“默认”)%的再现性NumSamples = 5 e2;adultdata = datasample (adultdata NumSamples,“替换”、假);

    训练一个GAM,该GAM包含预测因子的线性项和交互项。指定包含所有可用交互项P-值不大于0.05。

    Mdl=fitcgam(成人数据,“工资”,“互动”,“所有”,“最大值”,0.05)
    Mdl=ClassificationGAM预测名称:{1x14 cell}ResponseName:'salary'分类预测:[2 4 6 7 8 9 10 14]类名称:[<=50K>50K]ScoreTransform:'logit'截获:-32.0842交互:[82x2 double]numobervations:500个属性、方法

    Mdl是一个ClassificationGAM模型对象。Mdl包括82个交互术语。

    估计训练样本的边距和边缘Mdl

    M = resubMargin (Mdl);E = resubEdge (Mdl)
    E=1.0000

    估计训练样本的边距和边缘Mdl不包括交互项。

    M_nointeractions = resubMargin (Mdl,“IncludeInteractions”,false);E_nointeractions=重新沉积(Mdl,“IncludeInteractions”假)
    E_nointeractions = 0.9516

    使用方框图显示边距的分布。

    箱线图([M M_nointeractions],“标签”, {“线性和互动术语”,“仅限线性项”})标题(“训练样本边际的箱形图”)

    图中包含一个轴对象。标题为“训练样本边距的方框图”的轴对象包含14个类型为line的对象。

    当您在计算中包括交互项时,将为Mdl为1,再替换边值(边距的平均值)为1。当不包含交互项时,边距和边距会减小Mdl

    输入参数

    全部折叠

    分类机器学习模型,指定为完整的分类模型对象,所支持的模型如下表所示。金宝app

    模型 分类模型对象
    广义加性模型 ClassificationGAM
    K-最近邻模型 分类KNN
    朴素贝叶斯模型 分类朴素贝叶斯
    神经网络模型 ClassificationNeuralNetwork
    金宝app一类二值分类的支持向量机 ClassificationSVM

    标记以包含模型的交互术语,指定为真正的错误的.此论证仅对广义可加模型(GAM)有效。也就是说,您只能指定此参数MdlClassificationGAM

    默认值为真正的如果Mdl包含交互术语。该值必须为错误的如果模型不包含交互项。

    数据类型:必然的

    更多关于

    全部折叠

    分类边

    这个分类边是分类边距的加权平均值。

    在多个分类器中进行选择的一种方法是选择产生最大边的分类器,例如执行特征选择。

    分类保证金

    这个分类保证金二元分类是,对于每个观察,真实类的分类分数与虚假类的分类分数之间的差值。这个分类保证金对于多类分类,是真实类的分类分数与虚假类的最大分类分数之间的差值。

    如果边距在相同的尺度上(即,分数值基于相同的分数转换),那么它们将用作分类置信度度量。在多个分类器中,边距越大的分类器效果越好。

    算法

    再沉积根据相应的图像计算分类边缘边缘对象的功能(Mdl)。有关特定于模型的说明,请参阅边缘下表中的函数参考页。

    模型 分类模型对象(Mdl) 边缘目标函数
    广义加性模型 ClassificationGAM 边缘
    K-最近邻模型 分类KNN 边缘
    朴素贝叶斯模型 分类朴素贝叶斯 边缘
    神经网络模型 ClassificationNeuralNetwork 边缘
    金宝app一类二值分类的支持向量机 ClassificationSVM 边缘

    扩展能力

    介绍了R2012a