主要内容

错误

类:treebagger

错误(误分类概率或MSE)

句法

err =错误(b,tblnew,ynew)
呃=错误(B Xnew Ynew)
都会犯错误= (B TBLnew Ynew param1, val1, param2, val2,…)
err =错误(b,xnew,ynew,'param1',val1,'param2',val2,...)

描述

err =错误(b,tblnew,ynew)计算分类树的误分类概率或每棵树的回归树的均方误差(MSE),对于表中包含的预测器tblnew.给真实的反应ynew.。你可以省略ynew.如果tblnew.包含响应变量。如果你训练有素B.使用表中包含的示例数据,那么此方法的输入数据也必须在表中。

呃=错误(B Xnew Ynew)计算分类树的误分类概率或每棵树的回归树的均方误差(MSE),矩阵中包含的for预测因子Xnew.给真实的反应ynew.。如果你训练有素B.使用矩阵中包含的样本数据,然后该方法的输入数据也必须处于矩阵中。

的分类,ynew.可以是数字矢量,字符矩阵,字符串阵列,字符向量,分类矢量或逻辑向量的单元格数组。回归,y必须是数字矢量。犯错一个矢量是否每个都有一个误差测量ntree.合奏中的树B.

都会犯错误= (B TBLnew Ynew param1, val1, param2, val2,…)err =错误(b,xnew,ynew,'param1',val1,'param2',val2,...)指定可选的参数名称 - 值对:

'模式' 字符矢量或字符串标量,指示方法如何计算错误。如果设置为“累积”(默认),错误计算累积错误和犯错是长度的向量吗ntree.,第一个元素给出错误树木(1),第二个元素给出错误树木(1:2)等,树木(1:NTREES)。如果设置为'个人'犯错是长度的向量吗ntree.,其中每个元素是集合中的每棵树中的错误。如果设置为'合奏'犯错是一个标量,表示整个集合的累积误差。
'重量' 用于误差平均的观察重量矢量。默认情况下,每个观察的权重为1.该载体的长度必须等于行数X
“树” 指示在此计算中包括什么树的索引矢量。默认情况下,此参数设置为'所有'这种方法使用了所有的树。如果“树”是一个数值向量,方法返回一个长度向量ntree.对于“累积”'个人'模式,哪里ntree.输入向量中元素的个数,是一个标量吗'合奏'模式。例如,在“累积”模式,第一个元素给出错误树木(1),第二个元素给出错误树木(1:2)等。
“TreeWeights” 树重量传染媒介。该矢量必须具有与“树”向量。该方法使用这些权重,通过加权平均而不是简单的非加权多数投票来组合指定树的输出。你不能在'个人'模式。
“UseInstanceForTree” 逻辑矩阵大小脑袋——- - - - - -ntree.指示应该使用哪些树来对每次观测进行预测。默认情况下,该方法对所有的观察使用所有的树。

算法

估计总体误差时:

  • 使用'模式'名称-值对参数,您可以指定以以下三种方式中的任何一种返回错误:

    • 集合中的单个树的错误

    • 所有树木的累积错误

    • 整个系统的误差

  • 使用“树”名称-值对参数时,您可以指定在集成错误计算中使用哪些树。

  • 使用“UseInstanceForTree”名称值对参数,您可以指定输入数据中的观察(Xy)用于每个所选树的集合错误计算。

  • 使用'重量'名称值对参数,您可以归因于每个观察重量。对于遵循的公式,W.j是观察的重量j

  • 使用“TreeWeights”名称值对参数,您可以归因于每个重量。

对于回归问题,错误估计袋装回归树集合的加权MSE以预测y给予X使用所选树和观察。

  1. 错误预测所选观察的响应X使用集合中选择的回归树。

  2. MSE估计取决于价值'模式'

    • 如果您指定'模式','个人',则是树的加权均方误差T.

      均方误差 T. = 1 σ. j = 1 N W. j σ. j = 1 N W. j y j - y ^ T. j 2

      y ^ T. j 是观察的预测响应j从选定的回归树T.错误将所选树中的任何未选择的观察设置到所观察到的培训数据响应的加权样本平均值。

    • 如果您指定'模式','累积',加权的均方误差是一个大小向量T.*包含累积的,加权的均方误差T.*≤.T.选择的树木。错误遵循这些步骤来估计MSET.*,累积,加权MSE使用第一个T.选择的树木。

      1. 对于选定的观察jj= 1,......,N错误估计 y ^ T. j ,即第一批预测的加权平均值T.选择的树木(有关详细信息,请参阅预测)。对于这个计算,错误使用树权值。

      2. 错误通过树估计累积加权均方误差T.

        均方误差 T. * = 1 σ. j = 1 N W. j σ. j = 1 N W. j y j - y ^ T. j 2

      错误将所有选定的树木未选择的观察结果设置为观察到的培训数据响应的加权样本。

    • 如果您指定'mode','senemble'然后,加权MSE是累积的加权MSE向量的最后一个元素。

对于分类问题,错误估计袋装分类树的集合的加权错误分类率,以预测y给予X使用所选树和观察。

  • 如果您指定'模式','个人',然后加权得到树的误分类率T.

    E. T. = 1 σ. j = 1 N W. j σ. j = 1 N W. j 一世 y j y ^ T. j

    y ^ T. j 是所选观察的预测类j使用选定的分类树T.错误在选定的树中设置任何未选定的观察到的所有训练响应的预测、加权、最受欢迎的类。如果有多个最流行的类,错误考虑列表中第一个列出的Classnames.财产的treebagger模型是最受欢迎的。

  • 如果您指定'模式','累积'然后加权错误分类率是大小的矢量T.*含有累积的加权错误分类率T.*≤.T.选择的树木。错误遵循这些步骤来估计E.T.*,累积加权误分类率T.选择的树木。

    1. 对于选定的观察jj= 1,......,N错误估计 y ^ T. j ,加权,最受欢迎的课程中的第一个T.选择的树木(有关详细信息,请参阅预测)。对于这个计算,错误使用树权值。

    2. 错误通过树估计累积加权误分类率T.

      E. T. * = 1 σ. j = 1 N W. j σ. j = 1 N W. j 一世 y j y ^ T. j

      错误将所有未被选中树的观察结果设置为所有训练响应的预测加权最受欢迎的类。如果有多个最流行的类,错误考虑列表中第一个列出的Classnames.财产的treebagger模型是最受欢迎的。

  • 如果您指定'mode','senemble',则加权误分类率是累积加权误分类率向量的最后一个元素。