主要内容

预测

班级:treebagger

使用袋装决策树的集合来预测响应

句法

YFIT =预测(B,x)
YFIT =预测(B,X,名称,值)
[YFIT,STDEVS] =预测(___
[YFIT,得分] =预测(___
[YFIT,Scores,STDEVS] =预测(___

描述

YFIT =预测(B,x)返回表或矩阵中的预测响应的向量的向量X,基于袋装决策树的集合B.YFIT.是用于分类的字符向量的单元格数组和用于回归的数字数组。默认,预测从集合中的所有树木中汲取民主(非重量)平均投票。

B.是训练有素的treebagger模型对象,即返回的模型treebagger

X是用于生成响应的预测数据的表或矩阵。行表示观察和列代表变量。

  • 如果X是一个数字矩阵:

    • 构成列的变量X必须具有与培训的预测变量相同的顺序B.

    • 如果你训练有素B.使用表格(例如,TBL.), 然后X可以是一个数字矩阵TBL.包含所有数字预测变量。治疗数字预测器TBL.作为培训期间的分类,使用该识别分类预测因子分类预测器名称 - 值对参数treebagger。如果TBL.包含异构的预测变量(例如,数字和分类数据类型)和X是一个数字矩阵,然后预测抛出错误。

  • 如果X是一个表:

    • 预测不支持字符向量的单金宝app元格阵列以外的多列变量和单元格阵列。

    • 如果你训练有素B.使用表格(例如,TBL.),然后所有预测器变量都在X必须具有相同的变量名称,并且与培训的数据类型相同B.(存储在B.Predictornames.)。但是,列顺序X不需要对应于列顺序TBL.TBL.X可以包含其他变量(响应变量,观察权重等),但是预测忽略它们。

    • 如果你训练有素B.使用数字矩阵,然后是预测器名称B.Predictornames.和相应的预测变量名称X必须是一样的。要在培训期间指定预测器名称,请参阅预测名称 - 值对参数treebagger。所有预测因子变量X必须是数字向量。X可以包含其他变量(响应变量,观察权重等),但是预测忽略它们。

YFIT =预测(B,X,名称,价值使用一个或多个名称 - 值对参数指定其他选项:

  • '树木'- 用于计算响应的树索引数组。默认为'全部'

  • 'treeweights'- 阵列ntrees.从指定的树木加权投票的重量,在哪里ntrees.是集合中的树木数量。

  • 'umermstancefortree'- 逻辑矩阵大小谈判-经过-ntrees.指示用于对每个观察进行预测的树木,在哪里谈判是观察人数。默认情况下,所有树都用于所有观察。

回归,[YFIT,STDEVS] =预测(___还使用先前语法中的任何输入参数组合返回计算响应的标准偏差。

分类,[YFIT,得分] =预测(___也返回所有类的分数。得分是每个观察一行的矩阵,每类一列。对于每个观察和每个类,每个树产生的分数是源自类的观察的概率,计算为树叶中的类的观察分数。预测平均在合奏中的所有树木上的分数。

[YFIT,Scores,STDEVS] =预测(___还返回计算分数的标准偏差进行分类。STDEVS.是一个矩阵,每个观察一行和每级列一列,标准偏差在成长的树木的集合中取出。

算法

  • 对于回归问题,对观察的预测响应是仅使用所选树的预测的加权平均值。那是,

    y ^ = 1 σ. T. = 1 T. α. T. 一世 T. S. σ. T. = 1 T. α. T. y ^ T. 一世 T. S.

    • y ^ T. 是树的预测T.在合奏中。

    • S.是包含预测的所选树的一组指数(见'树木''umermstancefortree.')。 一世 T. S. 1如果是1T.在集合中S.和0否则。

    • α.T.是树的重量T.(看'we')。

  • 对于分类问题,观察的预测类是产生仅使用所选树计算的类后验概率(即,分类得分)的最大加权平均值的类。那是,

    1. 对于每个课程Cε.C和每棵树T.= 1,......,T.预测计算 P. ^ T. C | X ,这是估计的课程后部概率C鉴于观察X使用树T.C是培训数据中的所有不同类别的集合。有关分类树后部概率的更多详细信息,请参阅fitctree预测

    2. 预测在所选树上计算类后概率的加权平均值。

      P. ^ C | X = 1 σ. T. = 1 T. α. T. 一世 T. S. σ. T. = 1 T. α. T. P. ^ T. C | X 一世 T. S.

    3. 预测的类是产生最大加权平均值的类。

    y ^ = arg 最大限度 C C { P. ^ C | X }