主要内容

resubMargin

Resubstitution分类保证金

    描述

    例子

    = resubMargin (Mdl)返回resubstitution分类保证金()训练分类模型Mdl使用预测数据存储Mdl.X并存储在相应的正确的类标签Mdl.Y

    作为一个返回n1数字列向量,n是观测的数量的预测数据。

    例子

    = resubMargin (Mdl“IncludeInteractions”,includeInteractions)指定是否包括在计算交互术语。这个语法仅适用于广义可加模型。

    例子

    全部折叠

    估计resubstitution(样本)朴素贝叶斯分类器的分类的利润率。观察是观察到的真实类分数减去最大错误类分数在所有各自的班上成绩。

    加载fisheriris数据集创建。X作为一个数字矩阵,包含四个测量150虹膜。创建Y作为一个单元阵列包含相应的特征向量的虹膜的物种。

    负载fisheririsX =量;Y =物种;

    使用预测训练朴素贝叶斯分类器X和类标签Y。推荐的做法是指定类名。fitcnb假定每一个预测是有条件和正态分布。

    Mdl = fitcnb (X, Y,“类名”,{“setosa”,“多色的”,“virginica”})
    Mdl = ClassificationNaiveBayes ResponseName:‘Y’CategoricalPredictors:[]类名:{“setosa”“杂色的”“virginica”} ScoreTransform:“没有一个”NumObservations: 150 DistributionNames:{“正常”“正常”“正常”“正常”}DistributionParameters: {} 3 x4细胞属性,方法

    Mdl是一个培训ClassificationNaiveBayes分类器。

    估计resubstitution分类的利润率。

    m = resubMargin (Mdl);中位数(m)
    ans = 1.0000

    显示柱状图的分类中分类的利润率。

    30岁的直方图(m“归一化”,“概率”)包含(“样本内利润率”)ylabel (“概率”)标题(样本的概率分布的利润的)

    图包含一个坐标轴对象。坐标轴对象与标题样本的概率分布的利润率,样本包含的利润率,ylabel概率包含一个直方图类型的对象。

    分类器,产生相对较大的利润优先。

    样本进行特征选择通过比较利润从多个模型。完全基于这种比较,模型最高的利润率是最好的模型。

    加载电离层数据集定义两个数据集:

    • fullX包含所有预测(0的删除列除外)。

    • partX包含过去的20预测。

    负载电离层fullX = X;partX = X (:, end-20:结束);

    训练支持向量机(金宝appSVM)分类器为每个预测集。

    FullSVMModel = fitcsvm (fullX Y);PartSVMModel = fitcsvm (partX Y);

    估计每个分类器的分类中利润率。

    fullMargins = resubMargin (FullSVMModel);partMargins = resubMargin (PartSVMModel);n =大小(X, 1);p = (fullMargins < partMargins) / n
    p = 0.2222

    大约22%的利润率从完整的模型更少比用更少的预测模型。这一结果表明,模型训练所有的预测都是更好的。

    比较广义相加模型(GAM)与线性术语GAM线性和交互方面通过分析训练样本利润和优势。基于这种比较,利润率最高的分类器和边缘是最好的模型。

    1994年的人口普查数据加载存储census1994.mat。数据集由人口数据来自美国人口普查局预测一个人是否使每年超过50000美元。分类的任务是配合一个模型,预测人们的工资类别考虑到他们的年龄,工人阶级,教育程度、婚姻状况、种族、等等。

    负载census1994

    census1994包含了训练数据集adultdata和测试数据集成人。减少运行时间对于本例,二次抽样样品500训练观察adultdata通过使用datasample函数。

    rng (“默认”)%的再现性NumSamples = 5 e2;adultdata = datasample (adultdata NumSamples,“替换”、假);

    火车的GAM包含预测的线性和交互方面。指定包含所有可用的交互方面的p值不大于0.05。

    Mdl = fitcgam (adultdata,“工资”,“互动”,“所有”,“MaxPValue”,0.05)
    Mdl = ClassificationGAM PredictorNames:{‘年龄’‘workClass’‘fnlwgt’‘教育’‘education_num’‘marital_status’‘占领’的关系”“种族”“性”“capital_gain”“capital_loss”“hours_per_week”“native_country”} ResponseName:“工资”CategoricalPredictors:[2 4 6 7 8 9 10 14]一会:(< = 50 k > 50 k) ScoreTransform:分对数的截距:-28.5594交互:[82 x2双]NumObservations: 500属性,方法

    Mdl是一个ClassificationGAM模型对象。Mdl包括82个交互方面。

    估计的训练样本的利润率和边缘Mdl

    M = resubMargin (Mdl);E = resubEdge (Mdl)
    E = 1.0000

    估计的训练样本的利润率和边缘Mdl不包括交互方面。

    M_nointeractions = resubMargin (Mdl,“IncludeInteractions”、假);E_nointeractions = resubEdge (Mdl,“IncludeInteractions”假)
    E_nointeractions = 0.9516

    使用箱形图显示分布的利润率。

    箱线图([M M_nointeractions],“标签”,{“线性和交互条款”,“线性条件仅”})标题(训练样本的利润率的箱形图)

    图包含一个坐标轴对象。坐标轴对象与标题框块训练样本利润包含14线类型的对象。一个或多个行显示的值只使用标记

    当你包括交互项的计算,所有resubstitution利润值Mdl1,resubstitution边缘值(平均利润率)是1。边缘和边缘减少当你不包括交互条款Mdl

    输入参数

    全部折叠

    机器学习分类模型,指定为一个完整的分类模型对象,按照下表支持的模型。金宝app

    模型 分类模型对象
    广义加性模型 ClassificationGAM
    k最近的邻居模型 ClassificationKNN
    朴素贝叶斯模型 ClassificationNaiveBayes
    神经网络模型 ClassificationNeuralNetwork
    金宝app看到下面成了一和二分类支持向量机 ClassificationSVM

    标志包括交互模型,指定为真正的。这个论点是有效的只有一个广义相加模型(GAM)。也就是说,您可以指定这个论点只有当MdlClassificationGAM

    默认值是真正的如果Mdl包含交互方面。的值必须如果模型不包含交互方面。

    数据类型:逻辑

    更多关于

    全部折叠

    分类保证金

    分类保证金二进制分类,对每个观察,真正的类的分类得分之间的差异和分类评分错误类。的分类保证金对多类分类的分类评分之间的区别是对类和最大分类分错类。

    如果相同规模的利润(即得分值是基于相同的分数转换),然后他们作为衡量分类信心。在多个分类器,那些产生更大的利润更好。

    算法

    resubMargin根据相应的计算分类保证金保证金的函数对象(Mdl)。模型相关的描述,请参阅保证金下面的表函数参考页。

    模型 分类模型对象(Mdl) 保证金目标函数
    广义加性模型 ClassificationGAM 保证金
    k最近的邻居模型 ClassificationKNN 保证金
    朴素贝叶斯模型 ClassificationNaiveBayes 保证金
    神经网络模型 ClassificationNeuralNetwork 保证金
    金宝app看到下面成了一和二分类支持向量机 ClassificationSVM 保证金

    扩展功能

    版本历史

    介绍了R2012a