主要内容

resubEdge

Resubstitution分类边缘

    描述

    例子

    e= resubEdge (Mdl)返回加权resubstitution分类的优势(e)训练分类模型Mdl使用预测数据存储Mdl.X,存储在相应的正确的类标签Mdl.Y,存储在观察权重Mdl.W

    例子

    e= resubEdge (Mdl“IncludeInteractions”,includeInteractions)指定是否包括在计算交互术语。这个语法仅适用于广义可加模型。

    例子

    全部折叠

    加载电离层数据集。这个数据集有34个预测因子和351二进制响应雷达回报,要么坏(“b”)或好(‘g’)。

    负载电离层

    训练支持向量机(金宝appSVM)分类器。标准化的数据并指定‘g’是积极的类。

    SVMModel = fitcsvm (X, Y,“标准化”,真的,“类名”,{“b”,‘g’});

    SVMModel是一个培训ClassificationSVM分类器。

    估计resubstitution边缘,训练样本的均值的利润率。

    e = resubEdge (SVMModel)
    e = 5.0997

    分类器的分类器边缘措施的平均利润率。进行特征选择的方法之一是比较从多个模型训练样本的边缘。仅仅根据这一标准,最高的分类器边缘是最好的分类器。

    加载电离层数据集。删除前两个稳定的预测因子。

    负载电离层X = X(:, 3:结束);

    定义这两个数据集:

    • fullX包含所有预测。

    • partX包含10个最重要的预测因子。

    fullX = X;idx = fscmrmr (X, Y);partX = X (:, idx (1:10));

    火车一套朴素贝叶斯分类器对每个预测。

    FullMdl = fitcnb (fullX Y);PartMdl = fitcnb (partX Y);

    FullMdlPartMdl被训练ClassificationNaiveBayes分类器。

    估计每个分类器的训练样本的边缘。

    fullEdge = resubEdge (FullMdl)
    fullEdge = 0.6554
    partEdge = resubEdge (PartMdl)
    partEdge = 0.7796

    分类器训练的边缘上的10个最重要的因素是大。这个结果表明,分类器训练只使用那些预测样本有更好的健康。

    比较广义相加模型(GAM)与线性术语GAM线性和交互方面通过分析训练样本利润和优势。基于这种比较,利润率最高的分类器和边缘是最好的模型。

    1994年的人口普查数据加载存储census1994.mat。数据集由人口数据来自美国人口普查局预测一个人是否使每年超过50000美元。分类的任务是配合一个模型,预测人们的工资类别考虑到他们的年龄,工人阶级,教育程度、婚姻状况、种族、等等。

    负载census1994

    census1994包含了训练数据集adultdata和测试数据集成人。减少运行时间对于本例,二次抽样样品500训练观察adultdata通过使用datasample函数。

    rng (“默认”)%的再现性NumSamples = 5 e2;adultdata = datasample (adultdata NumSamples,“替换”、假);

    火车的GAM包含预测的线性和交互方面。指定包含所有可用的交互方面的p值不大于0.05。

    Mdl = fitcgam (adultdata,“工资”,“互动”,“所有”,“MaxPValue”,0.05)
    Mdl = ClassificationGAM PredictorNames:{‘年龄’‘workClass’‘fnlwgt’‘教育’‘education_num’‘marital_status’‘占领’的关系”“种族”“性”“capital_gain”“capital_loss”“hours_per_week”“native_country”} ResponseName:“工资”CategoricalPredictors:[2 4 6 7 8 9 10 14]一会:(< = 50 k > 50 k) ScoreTransform:分对数的截距:-28.5594交互:[82 x2双]NumObservations: 500属性,方法

    Mdl是一个ClassificationGAM模型对象。Mdl包括82个交互方面。

    估计的训练样本的利润率和边缘Mdl

    M = resubMargin (Mdl);E = resubEdge (Mdl)
    E = 1.0000

    估计的训练样本的利润率和边缘Mdl不包括交互方面。

    M_nointeractions = resubMargin (Mdl,“IncludeInteractions”、假);E_nointeractions = resubEdge (Mdl,“IncludeInteractions”假)
    E_nointeractions = 0.9516

    使用箱形图显示分布的利润率。

    箱线图([M M_nointeractions],“标签”,{“线性和交互条款”,“线性条件仅”})标题(训练样本的利润率的箱形图)

    图包含一个坐标轴对象。坐标轴对象与标题框块训练样本利润包含14线类型的对象。一个或多个行显示的值只使用标记

    当你包括交互项的计算,所有resubstitution利润值Mdl1,resubstitution边缘值(平均利润率)是1。边缘和边缘减少当你不包括交互条款Mdl

    输入参数

    全部折叠

    机器学习分类模型,指定为一个完整的分类模型对象,按照下表支持的模型。金宝app

    模型 分类模型对象
    广义加性模型 ClassificationGAM
    k最近的邻居模型 ClassificationKNN
    朴素贝叶斯模型 ClassificationNaiveBayes
    神经网络模型 ClassificationNeuralNetwork
    金宝app看到下面成了一和二分类支持向量机 ClassificationSVM

    标志包括交互模型,指定为真正的。这个论点是有效的只有一个广义相加模型(GAM)。也就是说,您可以指定这个论点只有当MdlClassificationGAM

    默认值是真正的如果Mdl包含交互方面。的值必须如果模型不包含交互方面。

    数据类型:逻辑

    更多关于

    全部折叠

    分类的优势

    分类的优势是分类的加权平均数的利润率。

    选择在多个分类器的一种方式,例如进行特征选择,是选择收益最大的边缘的分类器。

    分类保证金

    分类保证金二进制分类,对每个观察,真正的类的分类得分之间的差异和分类评分错误类。的分类保证金对多类分类的分类评分之间的区别是对类和最大分类分错类。

    如果相同规模的利润(即得分值是基于相同的分数转换),然后他们作为衡量分类信心。在多个分类器,那些产生更大的利润更好。

    算法

    resubEdge计算分类根据相应的边缘边缘的函数对象(Mdl)。模型相关的描述,请参阅边缘下面的表函数参考页。

    模型 分类模型对象(Mdl) 边缘目标函数
    广义加性模型 ClassificationGAM 边缘
    k最近的邻居模型 ClassificationKNN 边缘
    朴素贝叶斯模型 ClassificationNaiveBayes 边缘
    神经网络模型 ClassificationNeuralNetwork 边缘
    金宝app看到下面成了一和二分类支持向量机 ClassificationSVM 边缘

    扩展功能

    版本历史

    介绍了R2012a

    全部展开