主要内容gydF4y2Ba

rocmetricsgydF4y2Ba

接受者操作特征(ROC)曲线和二进制和多类分类器的性能指标gydF4y2Ba

自从R2022agydF4y2Ba

描述gydF4y2Ba

创建一个gydF4y2BarocmetricsgydF4y2Ba对象分类模型的性能进行评估gydF4y2Ba接受者操作特征(ROC)曲线gydF4y2Ba或其他性能指标。gydF4y2BarocmetricsgydF4y2Ba金宝app同时支持二进制和多类问题。gydF4y2Ba

对于每个类,gydF4y2BarocmetricsgydF4y2Ba计算性能指标gydF4y2Baone-versus-allgydF4y2BaROC曲线。可以计算指标平均使用ROC曲线gydF4y2Ba平均gydF4y2Ba函数。ROC曲线计算指标后,你可以把它们通过使用gydF4y2Ba情节gydF4y2Ba函数。gydF4y2Ba

默认情况下,gydF4y2BarocmetricsgydF4y2Ba利率计算假阳性(玻璃钢)和真阳性比率(TPR)获得和ROC曲线gydF4y2BaROC曲线下面积(AUC)gydF4y2Ba。你可以计算通过指定额外的指标gydF4y2BaAdditionalMetricsgydF4y2Ba名称-值参数,当你创建一个对象或通过调用gydF4y2BaaddMetricsgydF4y2Ba函数在您创建一个对象。一个gydF4y2BarocmetricsgydF4y2Ba对象存储计算指标和AUC值gydF4y2Ba指标gydF4y2Ba和gydF4y2BaAUCgydF4y2Ba属性,分别。gydF4y2Ba

rocmetricsgydF4y2Ba计算逐点的置信区间设置时的性能指标gydF4y2BaNumBootstrapsgydF4y2Ba价值一个正整数或当您指定旨在数据真正的类标签(gydF4y2Ba标签gydF4y2Ba),分类评分(gydF4y2Ba分数gydF4y2Ba),观察权重(gydF4y2Ba权重gydF4y2Ba)。有关详细信息,请参见gydF4y2Ba逐点的置信区间gydF4y2Ba。gydF4y2Ba

创建gydF4y2Ba

描述gydF4y2Ba

例子gydF4y2Ba

rocObjgydF4y2Ba= rocmetrics (gydF4y2Ba标签gydF4y2Ba,gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba一会gydF4y2Ba)gydF4y2Ba创建一个gydF4y2BarocmetricsgydF4y2Ba对象使用真正的类标签gydF4y2Ba标签gydF4y2Ba和分类评分gydF4y2Ba分数gydF4y2Ba。指定gydF4y2Ba标签gydF4y2Ba作为一个向量的长度n,并指定gydF4y2Ba分数gydF4y2Ba矩阵的大小gydF4y2BangydF4y2Ba——- - - - - -gydF4y2BaKgydF4y2Ba,在那里gydF4y2BangydF4y2Ba是观测的数量,和gydF4y2BaKgydF4y2Ba类的数量。gydF4y2Ba一会gydF4y2Ba指定的列顺序gydF4y2Ba分数gydF4y2Ba。gydF4y2Ba

的gydF4y2Ba指标gydF4y2Ba和gydF4y2BaAUCgydF4y2Ba属性包含性能指标和您指定的AUC值为每个类gydF4y2Ba分数gydF4y2Ba和gydF4y2Ba一会gydF4y2Ba。gydF4y2Ba

如果你指定旨在数据gydF4y2Ba标签gydF4y2Ba和gydF4y2Ba分数gydF4y2Ba作为细胞阵列,然后gydF4y2BarocmetricsgydF4y2Ba性能指标计算置信区间。gydF4y2Ba

例子gydF4y2Ba

rocObjgydF4y2Ba= rocmetrics (gydF4y2Ba标签gydF4y2Ba,gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba一会gydF4y2Ba,gydF4y2Ba名称=值gydF4y2Ba)gydF4y2Ba使用一个或多个名称参数指定附加选项。gydF4y2Ba例如,gydF4y2BaNumBootstraps = 100gydF4y2Ba吸引了100人前来引导样品性能指标计算置信区间。gydF4y2Ba

输入参数gydF4y2Ba

全部展开gydF4y2Ba

真正的类标签,指定为一个数值向量,逻辑向量,分类向量,字符数组,字符串数组或单元阵列特征向量。您还可以指定gydF4y2Ba标签gydF4y2Ba作为其中一个单元阵列为旨在数据类型。gydF4y2Ba

  • 数据,并非旨在的长度gydF4y2Ba标签gydF4y2Ba的行数gydF4y2Ba分数gydF4y2Ba必须是相等的。gydF4y2Ba

  • 对于旨在数据,您必须指定gydF4y2Ba标签gydF4y2Ba,gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba权重gydF4y2Ba与相同数量的细胞阵列元素。gydF4y2BarocmetricsgydF4y2Ba将细胞中的一个元素数组数据从一个交叉验证褶皱和计算点态性能指标的置信区间。的长度gydF4y2Ba标签{我}gydF4y2Ba的行数gydF4y2Ba分数{我}gydF4y2Ba必须是相等的。gydF4y2Ba

每一行的gydF4y2Ba标签gydF4y2Ba或gydF4y2Ba标签{我}gydF4y2Ba代表一个观察的真正的标签。gydF4y2Ba

这个参数设置gydF4y2Ba标签gydF4y2Ba财产。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba逻辑gydF4y2Ba|gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba

分数分类,指定为一个数字矩阵的数值矩阵或一个单元阵列。gydF4y2Ba

矩阵的每一行gydF4y2Ba分数gydF4y2Ba包含分类的一个观察所有类中指定gydF4y2Ba一会gydF4y2Ba。列的顺序gydF4y2Ba分数gydF4y2Ba必须匹配类顺序吗gydF4y2Ba一会gydF4y2Ba。gydF4y2Ba

  • 一个矩阵的输入,gydF4y2Ba分数(j, k)gydF4y2Ba分类的观察吗gydF4y2BajgydF4y2Ba为类gydF4y2Ba类名(k)gydF4y2Ba。gydF4y2Ba您可以指定gydF4y2Ba分数gydF4y2Ba通过使用第二个输出参数的gydF4y2Ba预测gydF4y2Ba函数的一个分类模型对象二进制分类和多类分类。例如,gydF4y2Ba预测gydF4y2Ba的gydF4y2BaClassificationTreegydF4y2Ba返回分数作为一个分类gydF4y2BangydF4y2Ba——- - - - - -gydF4y2BaKgydF4y2Ba矩阵,gydF4y2BangydF4y2Ba是观察和的数量吗gydF4y2BaKgydF4y2Ba是类。通过输出gydF4y2BarocmetricsgydF4y2Ba。gydF4y2Ba

    的行数gydF4y2Ba分数gydF4y2Ba的长度和gydF4y2Ba标签gydF4y2Ba必须是相等的。gydF4y2BarocmetricsgydF4y2Ba调整分数为每个类的分数相对于其他类。有关详细信息,请参见gydF4y2Ba调整分数多类分类问题gydF4y2Ba。gydF4y2Ba

  • 为一个向量输入,gydF4y2Ba评分(j)gydF4y2Ba分类的观察吗gydF4y2BajgydF4y2Ba中指定的类gydF4y2Ba一会gydF4y2Ba。gydF4y2Ba

    • 一会gydF4y2Ba必须只包含一个类。gydF4y2Ba

    • 之前gydF4y2Ba必须是双元素向量gydF4y2Ba前(1)gydF4y2Ba代表指定的类的先验概率。gydF4y2Ba

    • 成本gydF4y2Ba必须是一个gydF4y2Ba2gydF4y2Ba——- - - - - -gydF4y2Ba2gydF4y2Ba矩阵包含gydF4y2Ba(成本(P | P)、成本(N | P);成本(P | N)、成本(N | N))gydF4y2Ba,在那里gydF4y2BaPgydF4y2Ba是一个积极的类(类的指定分类的分数),然后呢gydF4y2BaNgydF4y2Ba是负类。gydF4y2Ba

    • 的长度gydF4y2Ba分数gydF4y2Ba的长度和gydF4y2Ba标签gydF4y2Ba必须是相等的。gydF4y2Ba

    如果你想显示模型操作点当你绘制ROC曲线使用gydF4y2Ba情节gydF4y2Ba函数的值gydF4y2Ba评分(j)gydF4y2Ba一定是后验概率。这一限制只适用于一个向量输入。gydF4y2Ba

  • 对于旨在数据,您必须指定gydF4y2Ba标签gydF4y2Ba,gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba权重gydF4y2Ba与相同数量的细胞阵列元素。gydF4y2BarocmetricsgydF4y2Ba将细胞中的一个元素数组数据从一个交叉验证褶皱和计算点态性能指标的置信区间。gydF4y2Ba我分数{}(j, k)gydF4y2Ba分类的观察吗gydF4y2BajgydF4y2Ba在元素gydF4y2Ba我gydF4y2Ba为类gydF4y2Ba类名(k)gydF4y2Ba。的行数gydF4y2Ba分数{我}gydF4y2Ba的长度和gydF4y2Ba标签{我}gydF4y2Ba必须是相等的。gydF4y2Ba

有关更多信息,请参见gydF4y2Ba分类分rocmetrics输入gydF4y2Ba。gydF4y2Ba

这个参数设置gydF4y2Ba分数gydF4y2Ba财产。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba

类名称,指定为一个数字矢量,逻辑向量,分类向量,字符数组,字符串数组或单元阵列特征向量。gydF4y2Ba一会gydF4y2Ba必须具有相同的数据类型作为真正的标签gydF4y2Ba标签gydF4y2Ba。中的值gydF4y2Ba一会gydF4y2Ba必须出现在gydF4y2Ba标签gydF4y2Ba。gydF4y2Ba

  • 如果您指定分类得分只有一个阶级gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba一会gydF4y2Ba仅指定这个类的名称。gydF4y2Ba

  • 否则,gydF4y2Ba一会gydF4y2Ba指定类的顺序gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba成本gydF4y2Ba,gydF4y2Ba之前gydF4y2Ba。gydF4y2Ba

这个参数设置gydF4y2Ba一会gydF4y2Ba财产。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba逻辑gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba|gydF4y2Ba分类gydF4y2Ba

名称-值参数gydF4y2Ba

指定可选的双参数作为gydF4y2BaName1 = Value1,…,以=家gydF4y2Ba,在那里gydF4y2Ba的名字gydF4y2Ba参数名称和吗gydF4y2Ba价值gydF4y2Ba相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。gydF4y2Ba

例子:gydF4y2BaFixedMetric =“FalsePositiveRate FixedMetricValues = 0:0.01:1gydF4y2Ba拥有固定的玻璃钢值gydF4y2Ba0:0.01:1gydF4y2Ba。gydF4y2Ba

性能指标gydF4y2Ba

全部展开gydF4y2Ba

额外的性能指标计算模型,指定为一个特征向量或内置的字符串标量度量名称,名称的字符串数组,函数处理(gydF4y2Ba@metricNamegydF4y2Ba),或者单元阵列名称或函数的句柄。一个gydF4y2BarocmetricsgydF4y2Ba对象总是计算假阳性的利率(玻璃钢)和真正的积极率(TPR)获得ROC曲线。因此,您不需要指定计算玻璃钢和TPR。gydF4y2Ba

  • 内置的指标——指定下列内置指标名称之一通过使用一个特征向量或字符串标量。您可以指定多个通过使用一个字符串数组。gydF4y2Ba

    的名字gydF4y2Ba 描述gydF4y2Ba
    “TruePositives”gydF4y2Ba或gydF4y2Ba“tp”gydF4y2Ba 真正的阳性(TP)数量gydF4y2Ba
    “FalseNegatives”gydF4y2Ba或gydF4y2Ba“fn”gydF4y2Ba 假阴性(FN)gydF4y2Ba
    “FalsePositives”gydF4y2Ba或gydF4y2Ba“外交政策”gydF4y2Ba 假阳性的数量(FP)gydF4y2Ba
    “TrueNegatives”gydF4y2Ba或gydF4y2Ba“tn”gydF4y2Ba 真正的底片(TN)数量gydF4y2Ba
    “SumOfTrueAndFalsePositives”gydF4y2Ba或gydF4y2Ba“tp + fp”gydF4y2Ba TP和FP的和gydF4y2Ba
    “RateOfPositivePredictions”gydF4y2Ba或gydF4y2Ba“齿”gydF4y2Ba 阳性预测率(RPP),gydF4y2Ba(TP + FP) / (TP + FN + FP + TN)gydF4y2Ba
    “RateOfNegativePredictions”gydF4y2Ba或gydF4y2Ba“rnp”gydF4y2Ba 率的负面预测(RNP),gydF4y2Ba(TN + FN) / (TP + FN + FP + TN)gydF4y2Ba
    “准确性”gydF4y2Ba或gydF4y2Ba“所以”gydF4y2Ba 的准确性,gydF4y2Ba(TP + TN) / (TP + FN + FP + TN)gydF4y2Ba
    “FalseNegativeRate”gydF4y2Ba,gydF4y2Ba“fnr”gydF4y2Ba,或gydF4y2Ba“小姐”gydF4y2Ba 假阴性率(FNR),或错过率,gydF4y2BaFN / (TP + FN)gydF4y2Ba
    “TrueNegativeRate”gydF4y2Ba,gydF4y2Ba“tnr”gydF4y2Ba,或gydF4y2Ba“规范”gydF4y2Ba 真阴性率(TNR)或特异性,gydF4y2BaTN / (TN + FP)gydF4y2Ba
    “PositivePredictiveValue”gydF4y2Ba,gydF4y2Ba“ppv”gydF4y2Ba,或gydF4y2Ba”前的“gydF4y2Ba 阳性预测值(PPV),或精度,gydF4y2BaTP / (TP + FP)gydF4y2Ba
    “NegativePredictiveValue”gydF4y2Ba或gydF4y2Ba“净现值”gydF4y2Ba 阴性预测值(NPV),gydF4y2BaTN / (TN + FN)gydF4y2Ba
    “ExpectedCost”gydF4y2Ba或gydF4y2Ba“ecost”gydF4y2Ba

    预期成本,gydF4y2Ba(TP *成本(P | P) + FN *成本(N | P) + FP *成本(P | N) + TN *成本(N | N)) / (TP + FN + FP + TN)gydF4y2Ba,在那里gydF4y2Ba成本gydF4y2Ba是一个2×2的误分类代价矩阵包含吗gydF4y2Ba[0,成本(N | P);成本(P | N), 0]gydF4y2Ba。gydF4y2Ba成本(N | P)gydF4y2Ba分类的成本类(是积极的gydF4y2BaPgydF4y2Ba)是一种消极类(gydF4y2BaNgydF4y2Ba),gydF4y2Ba成本(P | N)gydF4y2Ba分类的成本是负类作为正类。gydF4y2Ba

    软件转换gydF4y2BaKgydF4y2Ba——- - - - - -gydF4y2BaKgydF4y2Ba指定的矩阵gydF4y2Ba成本gydF4y2Ba名称-值参数gydF4y2BarocmetricsgydF4y2Ba每个one-versus-all二进制的2×2矩阵问题。有关详细信息,请参见gydF4y2Ba误分类代价矩阵gydF4y2Ba。gydF4y2Ba

    软件计算规模使用前类概率向量(gydF4y2Ba之前gydF4y2Ba)和类的数量gydF4y2Ba标签gydF4y2Ba,然后天平性能指标根据这种规模的向量。有关详细信息,请参见gydF4y2Ba性能指标gydF4y2Ba。gydF4y2Ba

  • 自定义指标——指定一个自定义指标通过使用一个函数处理。一个自定义函数,它返回一个性能指标必须有这种形式:gydF4y2Ba

    度量= customMetric (C、规模、成本)gydF4y2Ba

    • 输出参数gydF4y2Ba度规gydF4y2Ba是一个标量值。gydF4y2Ba

    • 一个自定义的度量是一个函数的混淆矩阵(gydF4y2BaCgydF4y2Ba)、尺度向量(gydF4y2Ba规模gydF4y2Ba),和成本矩阵(gydF4y2Ba成本gydF4y2Ba)。每个one-versus-all二进制软件发现这些输入值的问题。有关详细信息,请参见gydF4y2Ba性能指标gydF4y2Ba。gydF4y2Ba

      • CgydF4y2Ba是一个gydF4y2Ba2gydF4y2Ba——- - - - - -gydF4y2Ba2gydF4y2Ba混淆矩阵组成的gydF4y2Ba(TP, FN; FP, TN)gydF4y2Ba。gydF4y2Ba

      • 规模gydF4y2Ba是一个gydF4y2Ba2gydF4y2Ba——- - - - - -gydF4y2Ba1gydF4y2Ba尺度向量。gydF4y2Ba

      • 成本gydF4y2Ba是一个gydF4y2Ba2gydF4y2Ba——- - - - - -gydF4y2Ba2gydF4y2Ba误分类代价矩阵。gydF4y2Ba

    这个软件不支持自定义指标的交叉验证。金宝app相反,您可以指定使用当你创建一个引导gydF4y2BarocmetricsgydF4y2Ba对象。gydF4y2Ba

注意,阳性预测值(PPV)gydF4y2Ba南gydF4y2Ba为拒绝所有阈值gydF4y2BaTPgydF4y2Ba=gydF4y2Ba《外交政策》gydF4y2Ba=gydF4y2Ba0gydF4y2Ba和阴性预测值(NPV)gydF4y2Ba南gydF4y2Ba接受所有的阈值gydF4y2BaTNgydF4y2Ba=gydF4y2BaFNgydF4y2Ba=gydF4y2Ba0gydF4y2Ba。更多细节,请参阅gydF4y2Ba阈值、固定指标,和固定的度量值gydF4y2Ba。gydF4y2Ba

例子:gydF4y2BaAdditionalMetrics =(“准确性”,“PositivePredictiveValue”)gydF4y2Ba

例子:gydF4y2BaAdditionalMetrics ={“准确性”,@m1, @m2}gydF4y2Ba指定自定义的准确性度量和度量gydF4y2Bam1gydF4y2Ba和gydF4y2Ba平方米gydF4y2Ba作为额外的指标。gydF4y2BarocmetricsgydF4y2Ba存储自定义度量值作为变量命名gydF4y2BaCustomMetric1gydF4y2Ba和gydF4y2BaCustomMetric2gydF4y2Ba在gydF4y2Ba指标gydF4y2Ba财产。gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba|gydF4y2Bafunction_handlegydF4y2Ba

固定指标,指定为gydF4y2Ba“阈值”gydF4y2Ba,gydF4y2Ba“FalsePositiveRate”gydF4y2Ba(或gydF4y2Ba“玻璃钢”gydF4y2Ba),gydF4y2Ba“TruePositiveRate”gydF4y2Ba(或gydF4y2Ba“tpr”gydF4y2Ba),或者指定的一个度量gydF4y2BaAdditionalMetricsgydF4y2Ba名称-值参数。举行一个自定义指标固定,指定gydF4y2BaFixedMetricgydF4y2Ba作为gydF4y2Ba“CustomMetricN”gydF4y2Ba,在那里gydF4y2BaNgydF4y2Ba是指的是自定义的数量指标。例如,指定gydF4y2Ba“CustomMetric1”gydF4y2Ba使用指定的第一个自定义指标gydF4y2BaAdditionalMetricsgydF4y2Ba固定的指标。gydF4y2Ba

rocmetricsgydF4y2Ba发现ROC曲线和其他度量值对应的固定值(gydF4y2BaFixedMetricValuesgydF4y2Ba)的固定指标(gydF4y2BaFixedMetricgydF4y2Ba),商店中的值gydF4y2Ba指标gydF4y2Ba房地产作为一个表。更多细节,请参阅gydF4y2Ba阈值、固定指标,和固定的度量值gydF4y2Ba。gydF4y2Ba

如果gydF4y2BarocmetricsgydF4y2Ba计算置信区间,它使用两种方法计算,根据gydF4y2BaFixedMetricgydF4y2Ba值:gydF4y2Ba

  • 如果gydF4y2BaFixedMetricgydF4y2Ba是gydF4y2Ba“阈值”gydF4y2Ba(默认),gydF4y2BarocmetricsgydF4y2Ba使用阈值平均。gydF4y2Ba

  • 如果gydF4y2BaFixedMetricgydF4y2Ba是一个默认的值,gydF4y2BarocmetricsgydF4y2Ba使用垂直平均。gydF4y2Ba

有关详细信息,请参见gydF4y2Ba逐点的置信区间gydF4y2Ba。gydF4y2Ba

例子:gydF4y2BaFixedMetric = " TruePositiveRate "gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba

值固定的指标(gydF4y2BaFixedMetricgydF4y2Ba),指定为gydF4y2Ba“所有”gydF4y2Ba或一个数值向量。gydF4y2Ba

rocmetricsgydF4y2Ba发现ROC曲线和其他度量值对应的固定值(gydF4y2BaFixedMetricValuesgydF4y2Ba)的固定指标(gydF4y2BaFixedMetricgydF4y2Ba),商店中的值gydF4y2Ba指标gydF4y2Ba房地产作为一个表。gydF4y2Ba

默认的gydF4y2BaFixedMetricgydF4y2Ba值是gydF4y2Ba“阈值”gydF4y2Ba,默认的gydF4y2BaFixedMetricValuesgydF4y2Ba值是gydF4y2Ba“所有”gydF4y2Ba。对于每个类,gydF4y2BarocmetricsgydF4y2Ba使用所有不同的gydF4y2Ba调整分值gydF4y2Ba阈值和计算使用阈值的性能指标。根据gydF4y2BaUseNearestNeighborgydF4y2Ba设置,gydF4y2BarocmetricsgydF4y2Ba使用精确的阈值对应的固定值或最近的阈值。更多细节,请参阅gydF4y2Ba阈值、固定指标,和固定的度量值gydF4y2Ba。gydF4y2Ba

如果gydF4y2BarocmetricsgydF4y2Ba计算置信区间,它持有gydF4y2BaFixedMetricgydF4y2Ba固定在gydF4y2BaFixedMetricValuesgydF4y2Ba。gydF4y2Ba

  • FixedMetricgydF4y2Ba值是gydF4y2Ba“阈值”gydF4y2Ba,gydF4y2BaFixedMetricValuesgydF4y2Ba是gydF4y2Ba“所有”gydF4y2Ba- - - - - -gydF4y2BarocmetricsgydF4y2Ba计算置信区间的值对应于所有不同的阈值。gydF4y2Ba

  • FixedMetricgydF4y2Ba值是一个性能指标gydF4y2BaFixedMetricValuesgydF4y2Ba是gydF4y2Ba“所有”gydF4y2Ba- - - - - -gydF4y2BarocmetricsgydF4y2Ba找到相对应的度量值都不同的阈值,并计算置信区间度量值对应的值。gydF4y2Ba

有关详细信息,请参见gydF4y2Ba逐点的置信区间gydF4y2Ba。gydF4y2Ba

例子:gydF4y2BaFixedMetricValues = 0:0.01:1gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

南条件,指定为gydF4y2Ba“omitnan”gydF4y2Ba或gydF4y2Ba“includenan”gydF4y2Ba。gydF4y2Ba

  • “omitnan”gydF4y2Ba- - - - - -gydF4y2BarocmetricsgydF4y2Ba忽略所有gydF4y2Ba南gydF4y2Ba在输入分数值gydF4y2Ba分数gydF4y2Ba和相应的值gydF4y2Ba标签gydF4y2Ba和gydF4y2Ba权重gydF4y2Ba。gydF4y2Ba

  • “includenan”gydF4y2Ba- - - - - -gydF4y2BarocmetricsgydF4y2Ba使用gydF4y2Ba南gydF4y2Ba在输入分数值gydF4y2Ba分数gydF4y2Ba的计算。函数添加了观察gydF4y2Ba南gydF4y2Ba各自的班上成绩错误分类计数。即函数计算观测gydF4y2Ba南gydF4y2Ba分数从正类假阴性(FN)和计数观察gydF4y2Ba南gydF4y2Ba分数从负类假阳性(FP)。gydF4y2Ba

更多细节,请参阅gydF4y2Ba南得分值gydF4y2Ba。gydF4y2Ba

例子:gydF4y2BaNaNFlag = " includenan "gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba

指标使用最近的度量值,指定为逻辑gydF4y2Ba0gydF4y2Ba(gydF4y2Ba假gydF4y2Ba)或gydF4y2Ba1gydF4y2Ba(gydF4y2Ba真正的gydF4y2Ba)。gydF4y2Ba

  • 逻辑gydF4y2Ba0gydF4y2Ba(gydF4y2Ba假gydF4y2Ba)- - -gydF4y2BarocmetricsgydF4y2Ba使用精确的阈值对应于指定的固定度量值gydF4y2BaFixedMetricValuesgydF4y2Ba为gydF4y2BaFixedMetricgydF4y2Ba。gydF4y2Ba

  • 逻辑gydF4y2Ba1gydF4y2Ba(gydF4y2Ba真正的gydF4y2Ba)- - -在gydF4y2Ba调整输入分数gydF4y2Ba,gydF4y2BarocmetricsgydF4y2Ba发现最近的阈值的值对应于每个指定固定的度量值。gydF4y2Ba

更多细节,请参阅gydF4y2Ba阈值、固定指标,和固定的度量值gydF4y2Ba。gydF4y2Ba

的gydF4y2BaUseNearestNeighborgydF4y2Ba值必须是gydF4y2Ba假gydF4y2Ba如果gydF4y2BarocmetricsgydF4y2Ba计算置信区间。否则,默认值是gydF4y2Ba真正的gydF4y2Ba。gydF4y2Ba

例子:gydF4y2BaUseNearestNeighbor = falsegydF4y2Ba

数据类型:gydF4y2Ba逻辑gydF4y2Ba

选择分类模型gydF4y2Ba

全部展开gydF4y2Ba

误分类代价,指定为一个gydF4y2BaKgydF4y2Ba——- - - - - -gydF4y2BaKgydF4y2Ba方阵gydF4y2BaCgydF4y2Ba,在那里gydF4y2BaKgydF4y2Ba独特的类的数目在吗gydF4y2Ba标签gydF4y2Ba。gydF4y2BaC (i, j)gydF4y2Ba是一个指向类分类的成本gydF4y2BajgydF4y2Ba如果它真正的类gydF4y2Ba我gydF4y2Ba(即行对应于真正的阶级和列对应于预测类)。gydF4y2Ba一会gydF4y2Ba指定类的顺序。gydF4y2Ba

rocmetricsgydF4y2Ba转换gydF4y2BaKgydF4y2Ba——- - - - - -gydF4y2BaKgydF4y2Ba矩阵每个one-versus-all二进制的2×2矩阵问题。有关详细信息,请参见gydF4y2Ba误分类代价矩阵gydF4y2Ba。gydF4y2Ba

如果您指定分类得分只有一个阶级gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba成本gydF4y2Ba的值必须是一个gydF4y2Ba2gydF4y2Ba——- - - - - -gydF4y2Ba2gydF4y2Ba矩阵包含gydF4y2Ba[0,成本(N | P);成本(P | N), 0]gydF4y2Ba,在那里gydF4y2BaPgydF4y2Ba是一个积极的类(类的指定分类的分数),然后呢gydF4y2BaNgydF4y2Ba是负类。gydF4y2Ba成本(N | P)gydF4y2Ba是分类的成本正类作为负类,然后呢gydF4y2Ba成本(P | N)gydF4y2Ba分类的成本是负类作为正类。gydF4y2Ba

默认值是gydF4y2BaC (i, j) = 1gydF4y2Ba如果gydF4y2Ba我~ = jgydF4y2Ba,gydF4y2BaC (i, j) = 0gydF4y2Ba如果gydF4y2Ba我=我gydF4y2Ba。成本矩阵的对角元素必须是零。gydF4y2Ba

这个参数设置gydF4y2Ba成本gydF4y2Ba财产。gydF4y2Ba

例子:gydF4y2Ba成本= [0 2;1 0]gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

类概率之前,指定为以下之一:gydF4y2Ba

  • “经验”gydF4y2Ba确定类类频率的概率正确的类标签gydF4y2Ba标签gydF4y2Ba。如果你通过观察权重(gydF4y2Ba权重gydF4y2Ba),gydF4y2BarocmetricsgydF4y2Ba还使用概率权重计算类。gydF4y2Ba

  • “统一”gydF4y2Ba集所有类概率相等。gydF4y2Ba

  • 标量值向量,为每个类一个标量值。gydF4y2Ba一会gydF4y2Ba指定类的顺序。gydF4y2Ba

    如果您指定分类得分只有一个阶级gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba之前gydF4y2Ba值必须是一个双元素向量gydF4y2Ba前(1)gydF4y2Ba代表指定的类的先验概率。gydF4y2Ba

这个参数设置gydF4y2Ba之前gydF4y2Ba财产。gydF4y2Ba

例子:gydF4y2Ba之前= "统一"gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba

观察体重、指定为一个数值向量积极的价值观或包含数字的单元阵列向量的积极的价值观。gydF4y2Ba

  • 数据并不是旨在指定gydF4y2Ba权重gydF4y2Ba作为数值向量具有相同的长度gydF4y2Ba标签gydF4y2Ba。gydF4y2Ba

  • 对于旨在数据,您必须指定gydF4y2Ba标签gydF4y2Ba,gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba权重gydF4y2Ba与相同数量的细胞阵列元素。gydF4y2BarocmetricsgydF4y2Ba将细胞中的一个元素数组数据从一个交叉验证褶皱和计算点态性能指标的置信区间。的长度gydF4y2Ba权重{我}gydF4y2Ba的长度和gydF4y2Ba标签{我}gydF4y2Ba必须是相等的。gydF4y2Ba

rocmetricsgydF4y2Ba重的观察gydF4y2Ba标签gydF4y2Ba和gydF4y2Ba分数gydF4y2Ba与相应的值gydF4y2Ba权重gydF4y2Ba。如果你设置gydF4y2BaNumBootstrapsgydF4y2Ba一个正整数的价值,gydF4y2BarocmetricsgydF4y2Ba吸引与更换样品,利用权重多项抽样概率。gydF4y2Ba

默认情况下,gydF4y2Ba权重gydF4y2Ba是一个向量的或一个单元阵列包含向量的。gydF4y2Ba

这个参数设置gydF4y2Ba权重gydF4y2Ba财产。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba

置信区间的选择gydF4y2Ba

全部展开gydF4y2Ba

显著性水平的逐点的置信区间,指定为一个标量范围gydF4y2Ba(0,1)gydF4y2Ba。gydF4y2Ba

如果您指定gydF4y2BaαgydF4y2Ba作为gydF4y2BaαgydF4y2Ba,然后gydF4y2BarocmetricsgydF4y2Ba计算100×(1 -gydF4y2BaαgydF4y2Ba)%gydF4y2Ba逐点的置信区间gydF4y2Ba的性能指标。gydF4y2Ba

这个论点相关计算置信区间。因此,它是有效的只有当你指定旨在数据gydF4y2Ba标签gydF4y2Ba,gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba权重gydF4y2Ba,或者当你设置gydF4y2BaNumBootstrapsgydF4y2Ba一个正整数。gydF4y2Ba

例子:gydF4y2Baα= 0.01gydF4y2Ba指定99%置信区间。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

并行计算引导选项,指定为一个结构。gydF4y2Ba

您可以指定选择计算引导并行迭代和设置随机数在引导抽样。创建gydF4y2BaBootstrapOptionsgydF4y2Ba结构gydF4y2BastatsetgydF4y2Ba。此表列出了选项字段及其值。gydF4y2Ba

字段名gydF4y2Ba 字段值gydF4y2Ba 默认的gydF4y2Ba
UseParallelgydF4y2Ba

将这个值设置为gydF4y2Ba真正的gydF4y2Ba并行计算引导迭代。gydF4y2Ba

假gydF4y2Ba
UseSubstreamsgydF4y2Ba

将这个值设置为gydF4y2Ba真正的gydF4y2Ba并行计算可再生的方式运行。gydF4y2Ba

计算重复性良好gydF4y2Ba流gydF4y2Ba一个类型,允许substreams:gydF4y2Ba“mlfg6331_64”gydF4y2Ba或gydF4y2Ba“mrg32k3a”gydF4y2Ba。gydF4y2Ba

假gydF4y2Ba
流gydF4y2Ba

这个值指定为一个gydF4y2BaRandStreamgydF4y2Ba这样的对象的对象或单元阵列。除非使用一个对象gydF4y2BaUseParallelgydF4y2Ba值是gydF4y2Ba真正的gydF4y2Ba和gydF4y2BaUseSubstreamsgydF4y2Ba值是gydF4y2Ba假gydF4y2Ba。在这种情况下,使用相同的单元阵列大小平行池。gydF4y2Ba

如果你不指定gydF4y2Ba流gydF4y2Ba,然后gydF4y2BarocmetricsgydF4y2Ba使用默认的河流或溪流。gydF4y2Ba

这个论证是有效的只有当你指定gydF4y2BaNumBootstrapsgydF4y2Ba作为一个正整数计算置信区间使用引导。gydF4y2Ba

并行计算需要并行计算工具箱™。gydF4y2Ba

例子:gydF4y2BaBootstrapOptions = statset (UseParallel = true)gydF4y2Ba

数据类型:gydF4y2Ba结构体gydF4y2Ba

引导置信区间类型,指定为这个表中的值之一。gydF4y2Ba

价值gydF4y2Ba 描述gydF4y2Ba
“bca”gydF4y2Ba

偏差纠正和加速百分位方法gydF4y2Ba[8]gydF4y2Ba[9]gydF4y2Ba。这种方法涉及到gydF4y2BazgydF4y2Ba0gydF4y2Ba因子计算使用引导的比例值小于原样品的价值。块状样品时产生合理的结果,软件计算gydF4y2BazgydF4y2Ba0gydF4y2Ba通过包括一半的引导值和原样品一样的价值。gydF4y2Ba

“纠正百分位”gydF4y2Ba或gydF4y2Ba“cpe”gydF4y2Ba 偏差纠正百分位方法gydF4y2Ba[10]gydF4y2Ba
“正常”gydF4y2Ba或gydF4y2Ba“规范”gydF4y2Ba 正常的近似区间引导偏差和标准误差gydF4y2Ba[11]gydF4y2Ba
“百分比”gydF4y2Ba或gydF4y2Ba“每”gydF4y2Ba 基本百分位方法gydF4y2Ba
“学生”gydF4y2Ba或gydF4y2Ba“学生”gydF4y2Ba Studentized置信区间gydF4y2Ba[8]gydF4y2Ba

这个论证是有效的只有当你指定gydF4y2BaNumBootstrapsgydF4y2Ba作为一个正整数计算置信区间使用引导。gydF4y2Ba

例子:gydF4y2BaBootstrapType = "学生"gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba

引导画样本数量计算逐点的置信区间,指定为一个非负整数标量。gydF4y2Ba

如果您指定gydF4y2BaNumBootstrapsgydF4y2Ba一个正整数,那么gydF4y2BarocmetricsgydF4y2Ba使用gydF4y2BaNumBootstrapsgydF4y2Ba引导样品。创建每个引导样本,随机选择的函数gydF4y2BangydF4y2Ba出了gydF4y2BangydF4y2Ba行替换的输入数据。默认值gydF4y2Ba0gydF4y2Ba意味着gydF4y2BarocmetricsgydF4y2Ba不使用引导。gydF4y2Ba

rocmetricsgydF4y2Ba计算置信区间通过旨在数据或引导样品。因此,如果您指定旨在数据gydF4y2Ba标签gydF4y2Ba,gydF4y2Ba分数gydF4y2Ba,gydF4y2Ba权重gydF4y2Ba,然后gydF4y2BaNumBootstrapsgydF4y2Ba必须gydF4y2Ba0gydF4y2Ba。gydF4y2Ba

有关详细信息,请参见gydF4y2Ba逐点的置信区间gydF4y2Ba。gydF4y2Ba

例子:gydF4y2BaNumBootstraps = 500gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

studentized引导样品画的数量标准误差估计,指定为一个正整数标量。gydF4y2Ba

这个论证是有效的只有当你指定gydF4y2BaNumBootstrapsgydF4y2Ba作为一个正整数gydF4y2BaBootstrapTypegydF4y2Ba作为gydF4y2Ba“学生”gydF4y2Ba计算studentized引导置信区间。gydF4y2BarocmetricsgydF4y2Ba估计studentized通过使用标准误差估计gydF4y2BaNumBootstrapsStudentizedSEgydF4y2Ba引导数据样本。gydF4y2Ba

例子:gydF4y2BaNumBootstrapsStudentizedSE = 500gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

属性gydF4y2Ba

全部展开gydF4y2Ba

性能指标gydF4y2Ba

这个属性是只读的。gydF4y2Ba

ROC曲线下面积(AUC)gydF4y2Ba,指定为一个数值向量或矩阵。gydF4y2Ba

rocmetricsgydF4y2Ba计算每个one-versus-all的AUC ROC曲线(即为每一个类)。列的顺序gydF4y2BaAUCgydF4y2Ba属性值匹配的课堂秩序gydF4y2Ba一会gydF4y2Ba。gydF4y2Ba

为一个二进制的问题你指定的地方gydF4y2Ba分数gydF4y2Ba作为一个两列的矩阵,这个属性是一个gydF4y2Ba1gydF4y2Ba——- - - - - -gydF4y2Ba2gydF4y2Ba包含相同的AUC值向量。AUC值是相同的,因为在一个类是相同的模型的整体性能表现一个二进制的其他类的问题。gydF4y2Ba

如果gydF4y2BarocmetricsgydF4y2BaAUC的计算置信区间gydF4y2BaAUCgydF4y2Ba属性值是一个矩阵的第一行对应于AUC值,和第二和第三行对应的上下边界,分别。gydF4y2BarocmetricsgydF4y2Ba计算置信区间的AUC如果函数还为性能指标计算置信区间和设置gydF4y2BaFixedMetricgydF4y2Ba来gydF4y2Ba“阈值”gydF4y2Ba(默认),gydF4y2Ba“FalsePositiveRate”gydF4y2Ba,或gydF4y2Ba“TruePositiveRate”gydF4y2Ba。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

这个属性是只读的。gydF4y2Ba

性能指标,指定为一个表。gydF4y2Ba

表包含性能度量值类,垂直连接根据课堂秩序gydF4y2Ba一会gydF4y2Ba。每个独特的表有一行阈值为每个类。gydF4y2BarocmetricsgydF4y2Ba决定了阈值使用价值的基础上gydF4y2BaFixedMetricgydF4y2Ba,gydF4y2BaFixedMetricValuesgydF4y2Ba,gydF4y2BaUseNearestNeighborgydF4y2Ba。有关详细信息,请参见gydF4y2Ba阈值、固定指标,和固定的度量值gydF4y2Ba。gydF4y2Ba

对于表中的每个类的行数是唯一的阈值的数目。gydF4y2Ba

表的每一行包含这些变量:gydF4y2Ba类名称gydF4y2Ba,gydF4y2Ba阈值gydF4y2Ba,gydF4y2BaFalsePositiveRategydF4y2Ba,gydF4y2BaTruePositiveRategydF4y2Ba为每个额外的度量,以及变量中指定gydF4y2BaAdditionalMetricsgydF4y2Ba。如果您指定一个自定义度量,gydF4y2BarocmetricsgydF4y2Ba名度规gydF4y2Ba“CustomMetricN”gydF4y2Ba,在那里gydF4y2BaNgydF4y2Ba是指的是自定义的数量指标。例如,gydF4y2Ba“CustomMetric1”gydF4y2Ba对应于指定的第一个自定义指标gydF4y2BaAdditionalMetricsgydF4y2Ba。gydF4y2Ba

每个变量的gydF4y2Ba指标gydF4y2Ba表包含一个向量或一个三列的矩阵。gydF4y2Ba

  • 如果gydF4y2BarocmetricsgydF4y2Ba不计算置信区间,每个变量都包含一个向量。gydF4y2Ba

  • 如果gydF4y2BarocmetricsgydF4y2Ba计算置信区间,gydF4y2Ba类名称gydF4y2Ba和变量gydF4y2BaFixedMetricgydF4y2Ba(gydF4y2Ba阈值gydF4y2Ba,gydF4y2BaFalsePositiveRategydF4y2Ba,gydF4y2BaTruePositiveRategydF4y2Ba或额外的指标)包含一个向量,和其他变量包含一个三列的矩阵。矩阵的第一列对应于度量值,和第二和第三列对应的上下边界,分别。gydF4y2Ba

数据类型:gydF4y2Ba表gydF4y2Ba

分类模型属性gydF4y2Ba

当创建一个您可以指定以下属性gydF4y2BarocmetricsgydF4y2Ba对象。gydF4y2Ba

这个属性是只读的。gydF4y2Ba

类名称,指定为一个数字矢量,逻辑向量,分类向量,或单元阵列特征向量。gydF4y2Ba

,输入参数gydF4y2Ba一会gydF4y2Ba设置此属性。gydF4y2Ba(软件对字符或字符串数组作为细胞阵列特征向量)。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba逻辑gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba|gydF4y2Ba分类gydF4y2Ba

这个属性是只读的。gydF4y2Ba

误分类代价,指定为一个方阵。gydF4y2Ba

详情,请参阅gydF4y2Ba成本gydF4y2Ba名称-值参数,设置这个属性。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

这个属性是只读的。gydF4y2Ba

真正的类标签,指定为一个数值向量,逻辑向量,分类向量,单元阵列的特征向量,或细胞一系列旨在数据这些类型之一。gydF4y2Ba

,输入参数gydF4y2Ba标签gydF4y2Ba设置此属性。gydF4y2Ba(软件对字符或字符串数组作为细胞阵列特征向量)。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba逻辑gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba|gydF4y2Ba分类gydF4y2Ba

这个属性是只读的。gydF4y2Ba

类概率之前,指定为一个数值向量。gydF4y2Ba

详情,请参阅gydF4y2Ba之前gydF4y2Ba名称-值参数,设置这个属性。如果指定这个参数作为特征向量或字符串标量(gydF4y2Ba“经验”gydF4y2Ba或gydF4y2Ba“统一”gydF4y2Ba),gydF4y2BarocmetricsgydF4y2Ba计算先验概率和存储gydF4y2Ba之前gydF4y2Ba房地产作为一个数值向量。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

这个属性是只读的。gydF4y2Ba

分数分类,指定为一个数字矩阵的数值矩阵或一个单元阵列。gydF4y2Ba

,输入参数gydF4y2Ba分数gydF4y2Ba设置此属性。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba

这个属性是只读的。gydF4y2Ba

观察体重、指定为一个数值向量积极的价值观或包含数字的单元阵列向量的积极的价值观。gydF4y2Ba

详情,请参阅gydF4y2Ba权重gydF4y2Ba名称-值参数,设置这个属性。gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba

对象的功能gydF4y2Ba

addMetricsgydF4y2Ba 计算额外的分类性能指标gydF4y2Ba
平均gydF4y2Ba 计算性能指标平均接受者操作特征(ROC)曲线的多类问题gydF4y2Ba
情节gydF4y2Ba 情节接受者操作特征(ROC)曲线和其他性能曲线gydF4y2Ba

例子gydF4y2Ba

全部折叠gydF4y2Ba

计算的性能指标(玻璃钢和TPR)通过创建一个二进制分类问题gydF4y2BarocmetricsgydF4y2Ba使用对象,并绘制ROC曲线gydF4y2Ba情节gydF4y2Ba函数。gydF4y2Ba

加载gydF4y2Ba电离层gydF4y2Ba这个数据集的数据集。34预测(gydF4y2BaXgydF4y2Ba)和351二进制响应(gydF4y2BaYgydF4y2Ba)雷达的回报,要么坏(gydF4y2Ba“b”gydF4y2Ba)或好(gydF4y2Ba‘g’gydF4y2Ba)。gydF4y2Ba

负载gydF4y2Ba电离层gydF4y2Ba

分区数据分为训练集和测试集。使用大约80%的观察来训练支持向量机(SVM)模型,和20%的观察来测试新数据训练模型的性能。金宝app分区数据使用gydF4y2BacvpartitiongydF4y2Ba。gydF4y2Ba

rng (gydF4y2Ba“默认”gydF4y2Ba)gydF4y2Ba%的再现性分区gydF4y2Bac = cvpartition (Y,坚持= 0.20);trainingIndices =培训(c);gydF4y2Ba%训练集的指标gydF4y2BatestIndices =测试(c);gydF4y2Ba%测试集的指标gydF4y2BaXTrain = X (trainingIndices:);YTrain = Y (trainingIndices);XTest = X (testIndices:);欧美= Y (testIndices);gydF4y2Ba

训练支持向量机分类模型。gydF4y2Ba

Mdl = fitcsvm (XTrain YTrain);gydF4y2Ba

计算测试集的分类得分。gydF4y2Ba

[~,分数]=预测(Mdl XTest);大小(分数)gydF4y2Ba
ans =gydF4y2Ba1×2gydF4y2Ba70 2gydF4y2Ba

输出gydF4y2Ba分数gydF4y2Ba是一个矩阵的大小gydF4y2Ba70年gydF4y2Ba——- - - - - -gydF4y2Ba2gydF4y2Ba。列的顺序gydF4y2Ba分数gydF4y2Ba遵循课堂秩序gydF4y2BaMdlgydF4y2Ba。显示存储在类订单gydF4y2BaMdl.ClassNamesgydF4y2Ba。gydF4y2Ba

Mdl.ClassNamesgydF4y2Ba
ans =gydF4y2Ba2 x1细胞gydF4y2Ba{b} {' g '}gydF4y2Ba

创建一个gydF4y2BarocmetricsgydF4y2Ba对象通过使用真正的标签gydF4y2Ba欧美gydF4y2Ba和分类评分gydF4y2Ba分数gydF4y2Ba。指定的列顺序gydF4y2Ba分数gydF4y2Ba使用gydF4y2BaMdl.ClassNamesgydF4y2Ba。gydF4y2Ba

rocObj = rocmetrics(欧美,分数,Mdl.ClassNames);gydF4y2Ba

rocObjgydF4y2Ba是一个gydF4y2BarocmetricsgydF4y2Ba对象存储AUC值和每个类的性能指标gydF4y2BaAUCgydF4y2Ba和gydF4y2Ba指标gydF4y2Ba属性。显示gydF4y2BaAUCgydF4y2Ba财产。gydF4y2Ba

rocObj.AUCgydF4y2Ba
ans =gydF4y2Ba1×2gydF4y2Ba0.8587 - 0.8587gydF4y2Ba

二元分类问题,AUC值是相等的。gydF4y2Ba

的表gydF4y2Ba指标gydF4y2Ba包含两类的性能度量值,根据类垂直连接顺序。找到表中的第一行类,并显示前八行。gydF4y2Ba

idx = strcmp (rocObj.Metrics.ClassName Mdl.ClassNames (1));头(rocObj.Metrics (idx:))gydF4y2Ba
ClassName阈值FalsePositiveRate TruePositiveRate替_________________ ___________ {b} 15.545 0 0 0 0.04 15.545 {b} {b} 15.105 0 0.08 {b} 11.424 0 0 10.077 0.16 {b} {b} 0.2 9.9716 0.24 {b} 9.9417 0 0 0.32 0.28 9.0338 {b}gydF4y2Ba

情节为每个类通过使用ROC曲线gydF4y2Ba情节gydF4y2Ba函数。gydF4y2Ba

情节(rocObj)gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题ROC曲线,包含假阳性,ylabel真阳性率包含5 roccurve类型的对象,散点、线。这些对象代表b (AUC = 0.8587), b模型操作点,g (AUC = 0.8587), g模型操作点。gydF4y2Ba

对于每个类,gydF4y2Ba情节gydF4y2Ba功能块ROC曲线和标记显示一个实心圆模型操作点。传说显示类名和AUC值曲线。gydF4y2Ba

注意,您不需要检查ROC曲线为两类二元分类问题。两个ROC曲线对称,AUC值是相同的。一个类是一个真阴性率的TPR (TNR)其他类的,而且TNR 1-FPR。因此,TPR和玻璃钢的阴谋一个类是一样的一块1-FPR与1-TPR其他类。gydF4y2Ba

绘制ROC曲线只有指定的第一个类gydF4y2Ba一会gydF4y2Ba名称-值参数。gydF4y2Ba

情节(rocObj一会= Mdl.ClassNames (1))gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题ROC曲线,包含假阳性,ylabel真阳性率包含3 roccurve类型的对象,散点、线。这些对象代表b (AUC = 0.8587), b模型操作点。gydF4y2Ba

计算的性能指标(玻璃钢和TPR)通过创建一个多类分类问题gydF4y2BarocmetricsgydF4y2Ba为每个类对象,并绘制ROC曲线通过gydF4y2Ba情节gydF4y2Ba函数。指定gydF4y2BaAverageROCTypegydF4y2Ba名称-值参数gydF4y2Ba情节gydF4y2Ba创建的平均ROC曲线多类问题。gydF4y2Ba

加载gydF4y2BafisheririsgydF4y2Ba数据集。这个矩阵gydF4y2Ba量gydF4y2Ba包含150种不同的花的花测量。向量gydF4y2Ba物种gydF4y2Ba列出了每个花物种。gydF4y2Ba物种gydF4y2Ba包含三个不同的花的名字。gydF4y2Ba

负载gydF4y2BafisheririsgydF4y2Ba

训练一个分类树,将观察分为三个标签之一。旨在使用10倍交叉验证模型。gydF4y2Ba

rng (gydF4y2Ba“默认”gydF4y2Ba)gydF4y2Ba%的再现性gydF4y2BaMdl = fitctree(量、物种,Crossval =gydF4y2Ba“上”gydF4y2Ba);gydF4y2Ba

计算分类得分validation-fold观察。gydF4y2Ba

[~,分数]= kfoldPredict (Mdl);大小(分数)gydF4y2Ba
ans =gydF4y2Ba1×2gydF4y2Ba150年3gydF4y2Ba

输出gydF4y2Ba分数gydF4y2Ba是一个矩阵的大小gydF4y2Ba150年gydF4y2Ba——- - - - - -gydF4y2Ba3gydF4y2Ba。列的顺序gydF4y2Ba分数gydF4y2Ba遵循课堂秩序gydF4y2BaMdlgydF4y2Ba。显示存储在类订单gydF4y2BaMdl.ClassNamesgydF4y2Ba。gydF4y2Ba

Mdl.ClassNamesgydF4y2Ba
ans =gydF4y2Ba3 x1细胞gydF4y2Ba{' setosa}{“癣”}{' virginica '}gydF4y2Ba

创建一个gydF4y2BarocmetricsgydF4y2Ba对象通过使用真正的标签gydF4y2Ba物种gydF4y2Ba和分类评分gydF4y2Ba分数gydF4y2Ba。指定的列顺序gydF4y2Ba分数gydF4y2Ba使用gydF4y2BaMdl.ClassNamesgydF4y2Ba。gydF4y2Ba

rocObj = rocmetrics(物种,分数,Mdl.ClassNames);gydF4y2Ba

rocObjgydF4y2Ba是一个gydF4y2BarocmetricsgydF4y2Ba对象存储AUC值和每个类的性能指标gydF4y2BaAUCgydF4y2Ba和gydF4y2Ba指标gydF4y2Ba属性。显示gydF4y2BaAUCgydF4y2Ba财产。gydF4y2Ba

rocObj.AUCgydF4y2Ba
ans =gydF4y2Ba1×3gydF4y2Ba1.0000 0.9636 0.9636gydF4y2Ba

的表gydF4y2Ba指标gydF4y2Ba包含所有三个类的性能度量值,根据类垂直连接顺序。找到并显示表中的行第二课堂。gydF4y2Ba

idx = strcmp (rocObj.Metrics.ClassName Mdl.ClassNames (2));rocObj.Metrics (idx:)gydF4y2Ba
ans =gydF4y2Ba13×4表gydF4y2Ba_____ _________________ ___________ ClassName阈值FalsePositiveRate TruePositiveRate * * *{“癣”}1 0 0{“癣”}1 0.01 - 0.7{“癣”}0.95455 0.02 0.8{“癣”}0.91304 0.03 0.9{“癣”}-0.2 0.04 0.9{“癣”}-0.33333 0.06 0.9{“癣”}-0.6 0.08 0.9{“癣”}-0.86957 0.12 0.92{“癣”}-0.91111 0.16 0.96{“癣”}-0.95122 0.31 0.96{“癣”}-0.95238 0.38 0.98{“癣”}-0.95349 0.44 0.98{“癣”}1 1 1gydF4y2Ba

为每个类绘制ROC曲线。指定gydF4y2BaAverageROCType = "微"gydF4y2Ba计算性能指标平均使用micro-averaging ROC曲线法。gydF4y2Ba

情节(rocObj AverageROCType =gydF4y2Ba“微观”gydF4y2Ba)gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题ROC曲线,包含假阳性,ylabel真阳性率包含8 roccurve类型的对象,散点、线。这些对象代表setosa (AUC = 1), setosa模型操作点,多色的(AUC = 0.9636),杂色的模型操作点,virginica (AUC = 0.9636), virginica模型操作点,Micro-average (AUC = 0.9788)。gydF4y2Ba

标记的实心圆表示模型的操作点。传说显示类名和AUC值曲线。gydF4y2Ba

对于包含异常值的生成的样本,训练一个隔离森林模型和计算异常分数通过使用gydF4y2BaiforestgydF4y2Ba函数。gydF4y2BaiforestgydF4y2Ba返回分数作为一个向量。用分数来创建一个gydF4y2BarocmetricsgydF4y2Ba对象。情节precision-recall曲线使用异常分数,并找到森林模型的模型操作点隔离。gydF4y2Ba

使用高斯相关随机生成数据点的二维分布。gydF4y2Ba

rng (gydF4y2Ba“默认”gydF4y2Ba)ρ= [1,0.05,0.05,1];n = 1000;u = copularnd (gydF4y2Ba“高斯”gydF4y2Baρ,n);gydF4y2Ba

添加噪声的5%随机选择观察观察异常值。gydF4y2Ba

噪音= randperm (0.05 * n);true_tf = false (n, 1);true_tf(噪声)= true;u (true_tf 1) = (true_tf 1) * 5;gydF4y2Ba

火车一个隔离森林模型通过使用gydF4y2BaiforestgydF4y2Ba函数。指定的比例异常的训练观察为0.05。gydF4y2Ba

(f, tf,分数)= iforest (u, ContaminationFraction = 0.05);gydF4y2Ba

fgydF4y2Ba是一个gydF4y2BaIsolationForestgydF4y2Ba对象。gydF4y2BaiforestgydF4y2Ba还返回异常指标(gydF4y2Ba特遣部队gydF4y2Ba)和异常分数(gydF4y2Ba分数gydF4y2Ba训练数据)。gydF4y2BaiforestgydF4y2Ba确定阈值(gydF4y2Baf.ScoreThresholdgydF4y2Ba),这样的功能检测指定的分数训练观察异常。gydF4y2Ba

检查的性能gydF4y2BaIsolationForestgydF4y2Ba对象通过绘制precision-recall曲线和计算曲线下的面积(AUC)值。创建一个gydF4y2BarocmetricsgydF4y2Ba对象通过使用真正的异常指标(gydF4y2Batrue_tfgydF4y2Ba)和异常分数(gydF4y2Ba分数gydF4y2Ba)。得分值接近1显示异常,也值gydF4y2Ba真正的gydF4y2Ba在gydF4y2Batrue_tfgydF4y2Ba。因此,指定的类名gydF4y2Ba分数gydF4y2Ba作为gydF4y2Ba真正的gydF4y2Ba。指定gydF4y2BaAdditionalMetricsgydF4y2Ba名称-值参数计算精度值(或阳性预测值)。gydF4y2Ba

rocObj = rocmetrics (true_tf,分数,真的,AdditionalMetrics =gydF4y2Ba“PositivePredictiveValue”gydF4y2Ba);gydF4y2Ba

通过绘制曲线gydF4y2Ba情节gydF4y2Ba的函数gydF4y2BarocmetricsgydF4y2Ba。指定gydF4y2BaygydF4y2Ba设在度量精度(或阳性预测值)和gydF4y2BaxgydF4y2Ba设在度量回忆(或真阳性率)。显示一个实心圆模型对应于操作点gydF4y2Baf.ScoreThresholdgydF4y2Ba。计算precision-recall曲线下的面积使用的梯形法gydF4y2BatrapzgydF4y2Ba功能,并显示传说中的值。gydF4y2Ba

(rocObj YAxisMetric = r =阴谋gydF4y2Ba“PositivePredictiveValue”gydF4y2BaXAxisMetric =gydF4y2Ba“TruePositiveRate”gydF4y2Ba);持有gydF4y2Ba在gydF4y2Baidx =找到(rocObj.Metrics.Threshold > = f.ScoreThreshold 1gydF4y2Ba“最后一次”gydF4y2Ba);散射(rocObj.Metrics.TruePositiveRate (idx),gydF4y2Ba…gydF4y2BarocObj.Metrics.PositivePredictiveValue (idx),gydF4y2Ba…gydF4y2Ba[],r.ColorgydF4y2Ba“填充”gydF4y2Ba)xyData = rmmissing ([r。XData r.YData]);auc = trapz (xyData (: 1), xyData (:, 2));传奇(加入([r.DisplayNamegydF4y2Ba”(AUC = "gydF4y2Ba字符串(auc)gydF4y2Ba“)”gydF4y2Ba),gydF4y2Ba”“gydF4y2Ba),gydF4y2Ba“真正的模型操作点”gydF4y2Ba)包含(gydF4y2Ba“回忆”起gydF4y2Ba)ylabel (gydF4y2Ba“精度”gydF4y2Ba)标题(gydF4y2Ba“Precision-Recall曲线”gydF4y2Ba)举行gydF4y2Ba从gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题Precision-Recall曲线,包含召回,ylabel精度包含2 roccurve类型的对象,散射。这些对象代表真正的(AUC = 0.72846),真正的模型操作点。gydF4y2Ba

计算置信区间为玻璃钢和TPR固定阈值通过使用引导样品,和情节TPR的置信区间由使用ROC曲线gydF4y2Ba情节gydF4y2Ba函数。gydF4y2Ba

加载gydF4y2Ba电离层gydF4y2Ba这个数据集的数据集。34预测(gydF4y2BaXgydF4y2Ba)和351二进制响应(gydF4y2BaYgydF4y2Ba)雷达的回报,要么坏(gydF4y2Ba“b”gydF4y2Ba)或好(gydF4y2Ba‘g’gydF4y2Ba)。gydF4y2Ba

负载gydF4y2Ba电离层gydF4y2Ba

分区数据分为训练集和测试集。使用大约80%的观察来训练支持向量机(SVM)模型,和20%的观察来测试新数据训练模型的性能。金宝app分区数据使用gydF4y2BacvpartitiongydF4y2Ba。gydF4y2Ba

rng (gydF4y2Ba“默认”gydF4y2Ba)gydF4y2Ba%的再现性分区gydF4y2Bac = cvpartition (Y,坚持= 0.20);trainingIndices =培训(c);gydF4y2Ba%训练集的指标gydF4y2BatestIndices =测试(c);gydF4y2Ba%测试集的指标gydF4y2BaXTrain = X (trainingIndices:);YTrain = Y (trainingIndices);XTest = X (testIndices:);欧美= Y (testIndices);gydF4y2Ba

训练支持向量机分类模型。gydF4y2Ba

Mdl = fitcsvm (XTrain YTrain);gydF4y2Ba

计算测试集的分类得分。gydF4y2Ba

[~,分数]=预测(Mdl XTest);gydF4y2Ba

创建一个gydF4y2BarocmetricsgydF4y2Ba对象通过使用真正的标签gydF4y2Ba欧美gydF4y2Ba和分类评分gydF4y2Ba分数gydF4y2Ba。指定的列顺序gydF4y2Ba分数gydF4y2Ba使用gydF4y2BaMdl.ClassNamesgydF4y2Ba。指定gydF4y2BaNumBootstrapsgydF4y2Ba在100年使用100引导样品计算置信区间。gydF4y2Ba

Mdl.ClassNames rocObj = rocmetrics(欧美,分数,gydF4y2Ba…gydF4y2BaNumBootstraps = 100);gydF4y2Ba

寻找第二行类的表gydF4y2Ba指标gydF4y2Ba财产,前八行显示。gydF4y2Ba

idx = strcmp (rocObj.Metrics.ClassName Mdl.ClassNames (2));头(rocObj.Metrics (idx:))gydF4y2Ba
ClassName阈值FalsePositiveRate TruePositiveRate替__________________________ ________________________________ {‘g’} 7.1963 0 0 0 0 0 0 {‘g’} 7.1963 0 0 0 0 0.022222 0.093023 {‘g’} 6.2593 0 0 0 0 0.044444 0.11969 {‘g’} 5.5728 0 0 0 0.066667 0.020988 0.16024 5.5642 {‘g’} 0 0 0 0.088889 0.022635 0.18805 5.4619 - 0.04 {‘g’} 0 0.22222 0.088889 0.022635 0.18805 {‘g’} 5.3672 - 0.08 0 0.28 0.088889 0.022635 0.18805 {‘g’} 0 0.28 0.11111 0.045035 - 0.19532 5.1525 - 0.08gydF4y2Ba

表的每一行包含度量值及其置信区间为玻璃钢和TPR为一个固定的阈值。的gydF4y2Ba阈值gydF4y2Ba变量是一个列向量,gydF4y2BaFalsePositiveRategydF4y2Ba和gydF4y2BaTruePositiveRategydF4y2Ba变量是三列的矩阵。矩阵的第一列对应于度量值,和第二和第三列对应的上下边界,分别。gydF4y2Ba

绘制ROC曲线和TPR的置信区间。指定gydF4y2BaShowConfidenceIntervals = truegydF4y2Ba的置信区间,并指定一个类使用的阴谋gydF4y2Ba一会gydF4y2Ba名称-值参数。gydF4y2Ba

情节(rocObj ShowConfidenceIntervals = true,一会= Mdl.ClassNames (2))gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题ROC曲线,包含假阳性,ylabel真阳性率包含3 roccurve类型的对象,散点、线。这些对象代表g (AUC = 0.8587), g模型操作点。gydF4y2Ba

ROC曲线周围的阴影区域表示置信区间。置信区间代表由于方差曲线的不确定性测试集的训练模式。gydF4y2Ba

计算置信区间为玻璃钢和TPR固定阈值通过使用旨在数据,和情节TPR的置信区间由使用ROC曲线gydF4y2Ba情节gydF4y2Ba函数。gydF4y2Ba

加载gydF4y2BafisheririsgydF4y2Ba数据集。这个矩阵gydF4y2Ba量gydF4y2Ba包含150种不同的花的花测量。向量gydF4y2Ba物种gydF4y2Ba列出了每个花物种。gydF4y2Ba物种gydF4y2Ba包含三个不同的花的名字。gydF4y2Ba

负载gydF4y2BafisheririsgydF4y2Ba

火车一个朴素贝叶斯模型,观测到的三个分类标签。旨在使用10倍交叉验证模型。gydF4y2Ba

rng (gydF4y2Ba“默认”gydF4y2Ba)gydF4y2Ba%的再现性gydF4y2BaMdl = fitcnb(量、物种,Crossval =gydF4y2Ba“上”gydF4y2Ba);gydF4y2Ba

计算分类得分validation-fold观察。gydF4y2Ba

[~,分数]= kfoldPredict (Mdl);gydF4y2Ba

商店旨在分数和相应的正确的标签在细胞阵列,这样细胞数组中的每个元素对应于一个验证褶皱。gydF4y2Ba

简历= Mdl.Partition;numTestSets = cv.NumTestSets;cvLabels =细胞(numTestSets, 1);cvScores =细胞(numTestSets, 1);gydF4y2Ba为gydF4y2Bai = 1: numTestSets testIdx =测试(简历,我);cvLabels{我}=物种(testIdx);cvScores{我}=分数(testIdx:);gydF4y2Ba结束gydF4y2Ba

创建一个gydF4y2BarocmetricsgydF4y2Ba使用细胞数组对象。如果您指定正确的标签和分数通过细胞阵列,gydF4y2BarocmetricsgydF4y2Ba计算置信区间。gydF4y2Ba

rocObj = rocmetrics (cvLabels cvScores Mdl.ClassNames);gydF4y2Ba

绘制ROC曲线和TPR的置信区间。指定gydF4y2BaShowConfidenceIntervals = truegydF4y2Ba的置信区间。gydF4y2Ba

情节(rocObj ShowConfidenceIntervals = true)gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题ROC曲线,包含假阳性,ylabel真阳性率包含7 roccurve类型的对象,散点、线。这些对象代表setosa (AUC = 1), setosa模型操作点,多色的(AUC = 0.9896),杂色的模型操作点,virginica (AUC = 0.9896), virginica模型操作点。gydF4y2Ba

每个曲线周围的阴影区域表示置信区间。置信区间的宽度gydF4y2BasetosagydF4y2Ba为非零误报率是0,所以情节没有阴影区域gydF4y2BasetosagydF4y2Ba。置信区间反映不确定性模型中由于训练集和测试集的方差。gydF4y2Ba

火车三个不同的分类模型:决策树模型,广义加性模型,和朴素贝叶斯模型。比较三个模型的性能测试数据集使用ROC曲线和AUC值。gydF4y2Ba

1994年的人口普查数据加载存储gydF4y2Bacensus1994gydF4y2Ba.matgydF4y2Ba。数据集由人口数据来自美国人口普查局预测一个人是否使每年超过50000美元。gydF4y2Ba

负载gydF4y2Bacensus1994gydF4y2Ba

census1994gydF4y2Ba包含了训练数据集gydF4y2BaadultdatagydF4y2Ba和测试数据集gydF4y2Ba成人gydF4y2Ba。显示独特的反应变量中的值gydF4y2Ba工资gydF4y2Ba。gydF4y2Ba

一会=独特(adultdata.salary)gydF4y2Ba
一会=gydF4y2Ba2 x1分类gydF4y2Ba< = 50 k > 50 kgydF4y2Ba

火车三个模型通过训练数据gydF4y2BaadultdatagydF4y2Ba并指定响应变量名gydF4y2Ba“工资”gydF4y2Ba。通过使用指定的类gydF4y2Ba一会gydF4y2Ba名称-值参数。gydF4y2Ba

MdlTree = fitctree (adultdata,gydF4y2Ba“工资”gydF4y2Ba=类名、类名);MdlGAM = fitcgam (adultdata,gydF4y2Ba“工资”gydF4y2Ba=类名、类名);MdlNB = fitcnb (adultdata,gydF4y2Ba“工资”gydF4y2Ba=类名、类名);gydF4y2Ba

计算测试数据集的分类得分gydF4y2Ba成人gydF4y2Ba使用训练模型。gydF4y2Ba

[~,ScoresTree] =预测(MdlTree,成人);[~,ScoresGAM] =预测(MdlGAM,成人);[~,ScoresNB] =预测(MdlNB,成人);gydF4y2Ba

创建一个gydF4y2BarocmetricsgydF4y2Ba为每个模型对象。gydF4y2Ba

rocTree = rocmetrics (adulttest.salary ScoresTree,类名);rocGAM = rocmetrics (adulttest.salary ScoresGAM,类名);rocNB = rocmetrics (adulttest.salary ScoresNB,类名);gydF4y2Ba

为每个模型绘制ROC曲线。默认情况下,gydF4y2Ba情节gydF4y2Ba显示类名和函数的AUC值传奇。包括传说中的模型名称而不是类名称,修改gydF4y2BaDisplayNamegydF4y2Ba财产的gydF4y2BaROCCurvegydF4y2Ba返回的对象gydF4y2Ba情节gydF4y2Ba函数。gydF4y2Ba

图c =细胞(3,1);g =细胞(3,1);(g c{1},{1}] =情节((1)rocTree,一会=类名);持有gydF4y2Ba在gydF4y2Bag (c{2},{2}] =情节((1)rocGAM,一会=类名);(g c{3},{3}] =情节((1)rocNB,一会=类名);modelNames = [gydF4y2Ba“决策树模型”gydF4y2Ba,gydF4y2Ba…gydF4y2Ba“广义相加模型”gydF4y2Ba,gydF4y2Ba“朴素贝叶斯模型”gydF4y2Ba];gydF4y2Ba为gydF4y2Ba我= 1:3 c{我}。DisplayName=replace(c{i}.DisplayName,…gydF4y2Ba(1)字符串(类名),modelNames (i));g{我}(1)。DisplayName =加入([modelNames(我),gydF4y2Ba“操作点”gydF4y2Ba]);gydF4y2Ba结束gydF4y2Ba持有gydF4y2Ba从gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题ROC曲线,包含假阳性,ylabel真阳性率包含9 roccurve类型的对象,散点、线。这些对象代表决策树模型(AUC = 0.8297),操作点决策树模型,广义相加模型(AUC = 0.9182),广义相加模型操作点,朴素贝叶斯模型(AUC = 0.8902),朴素贝叶斯模型操作点。gydF4y2Ba

广义可加模型(gydF4y2BaMdlGAMgydF4y2Ba)AUC值最高,决策树模型(gydF4y2BaMdlTreegydF4y2Ba)最低。这个结果表明gydF4y2BaMdlGAMgydF4y2Ba有更好的平均性能测试数据集比gydF4y2BaMdlTreegydF4y2Ba和gydF4y2BaMdlNBgydF4y2Ba。gydF4y2Ba

发现该模型操作点和最优操作点二进制分类模型。分类观察一组测试数据通过使用一个新的阈值对应于最优操作点。gydF4y2Ba

加载gydF4y2Ba电离层gydF4y2Ba这个数据集的数据集。34预测(gydF4y2BaXgydF4y2Ba)和351二进制响应(gydF4y2BaYgydF4y2Ba)雷达的回报,要么坏(gydF4y2BabgydF4y2Ba)或好(gydF4y2BaggydF4y2Ba)。gydF4y2Ba

负载gydF4y2Ba电离层gydF4y2Ba

分区数据分为训练集和测试集。使用大约75%的观察来训练支持向量机(SVM)模型,和25%的观察来测试新数据训练模型的性能。金宝app分区数据使用gydF4y2BacvpartitiongydF4y2Ba。gydF4y2Ba

rng (gydF4y2Ba“默认”gydF4y2Ba)gydF4y2Ba%的再现性分区gydF4y2Bac = cvpartition (Y,坚持= 0.25);trainingIndices =培训(c);gydF4y2Ba%训练集的指标gydF4y2BatestIndices =测试(c);gydF4y2Ba%测试集的指标gydF4y2BaXTrain = X (trainingIndices:);YTrain = Y (trainingIndices);XTest = X (testIndices:);欧美= Y (testIndices);gydF4y2Ba

训练支持向量机分类模型。gydF4y2Ba

Mdl = fitcsvm (XTrain YTrain);gydF4y2Ba

显示存储在类订单gydF4y2BaMdl.ClassNamesgydF4y2Ba。gydF4y2Ba

Mdl.ClassNamesgydF4y2Ba
ans =gydF4y2Ba2 x1细胞gydF4y2Ba{b} {' g '}gydF4y2Ba

计算测试集的分类得分。gydF4y2Ba

(日元分数)=预测(Mdl XTest);gydF4y2Ba

创建一个gydF4y2BarocmetricsgydF4y2Ba对象通过使用真正的标签gydF4y2Ba欧美gydF4y2Ba和分类评分gydF4y2Ba分数gydF4y2Ba。指定的列顺序gydF4y2Ba分数gydF4y2Ba使用gydF4y2BaMdl.ClassNamesgydF4y2Ba。gydF4y2Ba

rocObj = rocmetrics(欧美,分数,Mdl.ClassNames);gydF4y2Ba

发现该模型操作点gydF4y2Ba指标gydF4y2Ba的属性gydF4y2BarocObjgydF4y2Ba为类gydF4y2BabgydF4y2Ba。的gydF4y2Ba预测gydF4y2Ba函数将一个观察分为类产生一个较大的分数,这对应于类与非负调整分。也就是说,使用的典型的阈值gydF4y2Ba预测gydF4y2Ba函数是0。行中gydF4y2Ba指标gydF4y2Ba的属性gydF4y2BarocObjgydF4y2Ba为类gydF4y2BabgydF4y2Ba,找到最小的负的阈值。曲线上的点表示相同性能的性能阈值0。gydF4y2Ba

idx_b = strcmp (rocObj.Metrics.ClassName,gydF4y2Ba“b”gydF4y2Ba);X = rocObj.Metrics (idx_b:) .FalsePositiveRate;:Y = rocObj.Metrics (idx_b) .TruePositiveRate;T = rocObj.Metrics (idx_b:) .Threshold;idx_model =找到(T > = 0, 1,gydF4y2Ba“最后一次”gydF4y2Ba);modelpt = [T (idx_model) X (idx_model) Y (idx_model)]gydF4y2Ba
modelpt =gydF4y2Ba1×3gydF4y2Ba1.2654 0.0179 0.5806gydF4y2Ba

二进制分类的最优操作点最小化平均误分类成本是一个点的ROC曲线相交直线的斜率gydF4y2Ba 米gydF4y2Ba ,在那里gydF4y2Ba 米gydF4y2Ba 被定义为gydF4y2Ba

米gydF4y2Ba =gydF4y2Ba 成本gydF4y2Ba (gydF4y2Ba PgydF4y2Ba |gydF4y2Ba NgydF4y2Ba )gydF4y2Ba - - - - - -gydF4y2Ba 成本gydF4y2Ba (gydF4y2Ba NgydF4y2Ba |gydF4y2Ba NgydF4y2Ba )gydF4y2Ba 成本gydF4y2Ba (gydF4y2Ba NgydF4y2Ba |gydF4y2Ba PgydF4y2Ba )gydF4y2Ba - - - - - -gydF4y2Ba 成本gydF4y2Ba (gydF4y2Ba PgydF4y2Ba |gydF4y2Ba PgydF4y2Ba )gydF4y2Ba ⋅gydF4y2Ba ngydF4y2Ba pgydF4y2Ba 。gydF4y2Ba

pgydF4y2Ba 观察的总数在积极的类,然后呢gydF4y2Ba ngydF4y2Ba 观察的总数在负类。的gydF4y2Ba成本gydF4y2Ba值的组件成本矩阵gydF4y2Ba CgydF4y2Ba :gydF4y2Ba

CgydF4y2Ba =gydF4y2Ba (gydF4y2Ba 成本gydF4y2Ba (gydF4y2Ba PgydF4y2Ba |gydF4y2Ba PgydF4y2Ba )gydF4y2Ba 成本gydF4y2Ba (gydF4y2Ba NgydF4y2Ba |gydF4y2Ba PgydF4y2Ba )gydF4y2Ba 成本gydF4y2Ba (gydF4y2Ba PgydF4y2Ba |gydF4y2Ba NgydF4y2Ba )gydF4y2Ba 成本gydF4y2Ba (gydF4y2Ba NgydF4y2Ba |gydF4y2Ba NgydF4y2Ba )gydF4y2Ba ]gydF4y2Ba

成本(N | P)gydF4y2Ba是分类的成本正类作为负类,然后呢gydF4y2Ba成本(P | N)gydF4y2Ba分类的成本是负类作为正类。根据课堂秩序gydF4y2BaMdl.ClassNamesgydF4y2Ba,积极类gydF4y2BaPgydF4y2Ba对应的类gydF4y2BabgydF4y2Ba。gydF4y2Ba

点之间的相交线的ROC曲线的斜率gydF4y2Ba 米gydF4y2Ba ,选择一个最接近完美的分类器(gydF4y2Ba玻璃钢= 0gydF4y2Ba,gydF4y2BaTPR = 1gydF4y2Ba),它完美的ROC曲线通过。gydF4y2Ba

积极的找到最优操作点类gydF4y2BabgydF4y2Ba。gydF4y2Ba

p =总和(strcmp(欧美,gydF4y2Ba“b”gydF4y2Ba));n =总和(~ strcmp(欧美,gydF4y2Ba“b”gydF4y2Ba));成本= Mdl.Cost;m =(成本(2,1)成本(2,2))/(成本(1、2)成本(1,1))* n / p;[~,idx_opt] = min (X - Y / m);optpt = [T (idx_opt) X (idx_opt) Y (idx_opt)]gydF4y2Ba
optpt =gydF4y2Ba1×3gydF4y2Ba-1.1978 0.1071 0.7742gydF4y2Ba

绘制ROC曲线类gydF4y2BabgydF4y2Ba通过使用gydF4y2Ba情节gydF4y2Ba功能,并显示通过使用最优操作点gydF4y2Ba散射gydF4y2Ba函数。gydF4y2Ba

图(rocObj,一会= r =阴谋gydF4y2Ba“b”gydF4y2Ba);持有gydF4y2Ba在gydF4y2Ba散射(optpt (2), optpt (3),gydF4y2Ba“填充”gydF4y2Ba,gydF4y2Ba…gydF4y2BaDisplayName =gydF4y2Ba“b最佳操作点”gydF4y2Ba);gydF4y2Ba

图包含一个坐标轴对象。坐标轴对象与标题ROC曲线,包含假阳性,ylabel真阳性率包含4 roccurve类型的对象,散点、线。这些对象代表b (AUC = 0.845), b模型操作点,b最佳操作点。gydF4y2Ba

显示模型操作点和最优操作点。gydF4y2Ba

array2table ([modelpt; optpt),gydF4y2Ba…gydF4y2BaRowNames = [gydF4y2Ba“模型操作点”gydF4y2Ba“最优操作点”gydF4y2Ba),gydF4y2Ba…gydF4y2BaVariableNames = [gydF4y2Ba“阈值”gydF4y2Ba“FalsePositiveRate”gydF4y2Ba“TruePositiveRate”gydF4y2Ba])gydF4y2Ba
ans =gydF4y2Ba2×3表gydF4y2Ba阈值FalsePositiveRate TruePositiveRate _____ _________________ ___________模型操作点-1.1978 0.10714 0.77419 1.2654 0.017857 0.58065最优操作点gydF4y2Ba

分类gydF4y2BaXTestgydF4y2Ba使用最优操作点。分配一个观察的调整分大于或等于最优阈值的积极类gydF4y2BabgydF4y2Ba。gydF4y2Ba

s =分数(:1)——分数(:,2);idx_b_opt = (s > = optpt (1));Y2 =细胞(大小(欧美));Y2 (idx_b_opt) = {gydF4y2Ba“b”gydF4y2Ba};Y2 (~ idx_b_opt) = {gydF4y2Ba‘g’gydF4y2Ba};gydF4y2Ba

的观测显示调整分数有不同的标签gydF4y2Ba日元gydF4y2Ba(标签gydF4y2Ba预测gydF4y2Ba功能),gydF4y2BaY2gydF4y2Ba(标签从最优阈值gydF4y2Baoptpt (1)gydF4y2Ba)。gydF4y2Ba

(~比较字符串(Y1, Y2))gydF4y2Ba
ans =gydF4y2Ba11×1gydF4y2Ba-1.1703 -0.8445 -0.8235 -0.4546 -1.0719 -0.4612 -0.2191 -1.1978 -1.0114 -1.1552⋮gydF4y2Ba

十一观察调整分数不到gydF4y2Ba0gydF4y2Ba但大于或等于最优阈值。gydF4y2Ba

训练后的模型对多类分类问题,创建一个gydF4y2BarocmetricsgydF4y2Ba感兴趣的对象类。指定gydF4y2BaFixedMetricValuesgydF4y2Ba这gydF4y2BarocmetricsgydF4y2Ba计算指定的阈值的性能指标。gydF4y2Ba

样例文件读取gydF4y2BaCreditRating_Historical.datgydF4y2Ba一个表中。预测数据由财务比率和企业客户的行业信息列表。响应变量由评级机构的信用评级分配。预览数据集的前几行。gydF4y2Ba

creditrating = readtable (gydF4y2Ba“CreditRating_Historical.dat”gydF4y2Ba);头(creditrating)gydF4y2Ba
ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业评级_____持续累积________ _____ ________ 62394 0.013 0.104 0.036 0.447 0.142 3 {“BB”} 48608 0.232 0.335 0.062 1.969 0.281 8 {A} 42444 0.311 0.367 0.074 1.935 0.366 1 {A} 48631 0.194 0.263 0.062 1.017 0.228 - 4 {BBB的}43768 0.121 0.413 0.057 3.647 0.466 12 {' AAA '} 39255 -0.117 -0.799 0.01 0.179 0.082 - 4 {“CCC”} 62236 0.087 0.158 0.049 0.816 0.324 - 2 {BBB的}39354 0.005 0.181 0.034 2.597 0.388 7 {“AA”}gydF4y2Ba

因为每个值gydF4y2BaIDgydF4y2Ba变量是一个独特的客户ID,即gydF4y2Ba长度(独特(creditrating.ID))gydF4y2Ba等于观测的数量gydF4y2BacreditratinggydF4y2Ba,gydF4y2BaIDgydF4y2Ba变量是一个可怜的预测。删除gydF4y2BaIDgydF4y2Ba从表中变量和转换gydF4y2Ba行业gydF4y2Ba变量,gydF4y2Ba分类gydF4y2Ba变量。gydF4y2Ba

creditrating = removevars (creditrating,gydF4y2Ba“ID”gydF4y2Ba);creditrating。行业=分类(creditrating。行业);gydF4y2Ba

分区数据分为训练集和测试集。使用大约80%的观察来训练一个神经网络模型,和20%的观察来测试新数据训练模型的性能。分区数据使用gydF4y2BacvpartitiongydF4y2Ba。gydF4y2Ba

rng (gydF4y2Ba“默认”gydF4y2Ba)gydF4y2Ba%的再现性分区gydF4y2Bac = cvpartition (creditrating.RatinggydF4y2Ba“坚持”gydF4y2Ba,0.20);trainingIndices =培训(c);gydF4y2Ba%训练集的指标gydF4y2BatestIndices =测试(c);gydF4y2Ba%测试集的指标gydF4y2BacreditTrain = creditrating (trainingIndices:);信贷= creditrating (testIndices:);gydF4y2Ba

训练一个神经网络分类器通过训练数据gydF4y2BacreditTraingydF4y2Ba到gydF4y2BafitcnetgydF4y2Ba函数。gydF4y2Ba

Mdl = fitcnet (creditTrain,gydF4y2Ba“评级”gydF4y2Ba);gydF4y2Ba

信用评级得分计算分类和预测的测试集观测。gydF4y2Ba

(标签、分数)=预测(Mdl信贷);gydF4y2Ba

神经网络分类器的分类分数对应的后验概率。gydF4y2Ba

假设你想评估模型只对评级gydF4y2BaBgydF4y2Ba,gydF4y2BaBBgydF4y2Ba,gydF4y2BaBBBgydF4y2Ba,而忽略其余的评级。gydF4y2Ba

显示的顺序存储在的评级模型gydF4y2Ba一会gydF4y2Ba财产,确定评估的类。gydF4y2Ba

Mdl.ClassNamesgydF4y2Ba
ans =gydF4y2Ba7 x1细胞gydF4y2Ba{A} {“AA”} {' AAA '} {B} {“BB”} {BBB的}{“CCC”}gydF4y2Ba
idx_Class = (4 5 6);classesToEvaluate = Mdl.ClassNames (idx_Class);gydF4y2Ba

找到三个类的观察的指标(gydF4y2BaBgydF4y2Ba,gydF4y2BaBBgydF4y2Ba,gydF4y2BaBBBgydF4y2Ba)。gydF4y2Ba

idx = ismember (creditTest.Rating classesToEvaluate);gydF4y2Ba

创建一个gydF4y2BarocmetricsgydF4y2Ba对象使用真正的标签和分数的三个类。指定gydF4y2BaFixedMetricValues = 1: -0.25: 1gydF4y2Ba这gydF4y2BarocmetricsgydF4y2Ba计算指定的阈值的性能指标。gydF4y2Ba

阈值= 1:-0.25:1;rocObj = rocmetrics (creditTest.Rating (idx),分数(idx idx_Class),gydF4y2Ba…gydF4y2BaclassesToEvaluate FixedMetricValues =阈值);gydF4y2Ba

显示存储在计算指标gydF4y2Ba指标gydF4y2Ba财产。gydF4y2Ba

rocObj.MetricsgydF4y2Ba
ans =gydF4y2Ba27×4表gydF4y2BaClassName阈值FalsePositiveRate TruePositiveRate替_________________ ___________ {B} 0.90791 0 0 0 0.10938 0.79653 {B} {B} 0.51646 0.010309 0.3125 {B} 0.26178 0.020619 0.42188 0.0050218 - 0.048969 {B} {B} 0.57812 -0.24632 0.10567 0.6875 -0.49531 - 0.1701 {B} {B} 0.76562 -0.7495 0.5232 0.85938 -0.97041 {B} 1 1 0 0 0.95629 {“BB”} {“BB”} 0.75876 0.044944 0.18378 0.50145 - 0.10112 {“BB”} {“BB”} 0.25367 0.14981 0.61081 0.44865 0.0013125 - 0.23221 {“BB”} {“BB”} -0.24929 0.34457 0.86486 0.75135 {“BB”} -0.49761 0.48315 0.93514⋮gydF4y2Ba

的gydF4y2Ba指标gydF4y2Ba属性包含三个性能指标的评级gydF4y2BaBgydF4y2Ba,gydF4y2BaBBgydF4y2Ba,gydF4y2BaBBBgydF4y2Ba和指定的阈值。默认的gydF4y2BaUseNearestNeighborgydF4y2Ba值是gydF4y2Ba真正的gydF4y2Ba如果gydF4y2BarocmetricsgydF4y2Ba不计算置信区间。因此,对于每一个指定的阈值,gydF4y2BarocmetricsgydF4y2Ba选择最近的一个调整分值指定的值,并使用最近的值作为阈值。显示指定的阈值和实际阈值用于每个类。gydF4y2Ba

idx_B = strcmp (rocObj.Metrics.ClassName,gydF4y2Ba“B”gydF4y2Ba);idx_BB = strcmp (rocObj.Metrics.ClassName,gydF4y2Ba“BB”gydF4y2Ba);idx_BBB = strcmp (rocObj.Metrics.ClassName,gydF4y2Ba" BBB "gydF4y2Ba);表(阈值”,rocObj.Metrics.Threshold (idx_B),gydF4y2Ba…gydF4y2BarocObj.Metrics.Threshold (idx_BB),gydF4y2Ba…gydF4y2BarocObj.Metrics.Threshold (idx_BBB),gydF4y2Ba…gydF4y2BaVariableNames = [gydF4y2Ba“固定阈值”gydF4y2Ba;字符串(classesToEvaluate)])gydF4y2Ba
ans =gydF4y2Ba9×4表gydF4y2Ba固定阈值B替________ BB BBB售予1 0.90791 0.95629 0.93627 0.75 0.79653 0.75876 0.7576 0.5 0.51646 0.50145 0.50054 0.25 0.26178 0.25367 0.26181 0 0.0050218 0.0013125 0.028665 -0.25 -0.24632 -0.24929 -0.24645 -0.5 -0.49531 -0.49761 -0.49942 -0.75 -0.97041 -0.93627 -0.96758 -0.7495 -0.74873 -0.74982 1gydF4y2Ba

更多关于gydF4y2Ba

全部展开gydF4y2Ba

算法gydF4y2Ba

全部展开gydF4y2Ba

引用gydF4y2Ba

[1]福西特,t .“ROC曲线图:笔记和实际问题研究”,gydF4y2Ba机器学习gydF4y2Ba31日。1 (2004):1-38。gydF4y2Ba

[2]茨威格,M。,G. Campbell. “Receiver-Operating Characteristic (ROC) Plots: A Fundamental Evaluation Tool in Clinical Medicine.”临床化学gydF4y2Ba39岁的没有。4 (1993):561 - 577。gydF4y2Ba

[3]戴维斯,J。,M. Goadrich. “The Relationship Between Precision-Recall and ROC Curves.”ICML 06年学报》上gydF4y2Ba,2006年,页233 - 240。gydF4y2Ba

Moskowitz [4], c . S。和m . s .佩佩。“量化和比较连续的二进制的预后因素的预测精度的结果。”gydF4y2Ba生物统计学gydF4y2Ba5,不。1(2004):113 - 27所示。gydF4y2Ba

[5],Y。,M. S. Pepe, and Z. Feng. “Evaluating the Predictiveness of a Continuous Marker.”美国华盛顿生物统计学纸系列gydF4y2Ba,2006,250 - 61。gydF4y2Ba

[6]Briggs, w . M。,R. Zaretzki. “The Skill Plot: A Graphical Technique for Evaluating Continuous Diagnostic Tests.”生物识别技术gydF4y2Ba64年,没有。1 (2008):250 - 256。gydF4y2Ba

[7]押注,r .厂商“分类器选择使用ROC凸包方法。”gydF4y2BaSAS研究所gydF4y2Ba,2003年。gydF4y2Ba

[8]DiCiccio托马斯·J。,布拉德利·埃夫隆。“引导置信区间”。gydF4y2Ba统计科学gydF4y2Ba11日,没有。3 (1996):189 - 228。gydF4y2Ba

[9]·埃夫隆、布拉德利和罗伯特·j·Tibshirani。gydF4y2Ba介绍了引导gydF4y2Ba。纽约:查普曼&大厅,1993。gydF4y2Ba

[10]埃夫隆,布拉德利。gydF4y2Ba重叠,引导和其他重采样计划。gydF4y2Ba费城:工业与应用数学学会,1982年。gydF4y2Ba

[11]戴维森,a . C。,D. V. Hinkley.引导方法和他们的应用程序。gydF4y2Ba剑桥大学出版社,1997年。gydF4y2Ba

扩展功能gydF4y2Ba

版本历史gydF4y2Ba

介绍了R2022agydF4y2Ba