袋决策树
treebagger
将决策树集合用于分类或回归。Bagging代表引导聚合。集合中的每棵树都是在输入数据的独立绘制的引导副本上生长的。不包括在这个副本中的观察结果对于这个树来说是“out of bag”。
treebagger
依靠ClassificationTree
和RegressionTree
生长单独的树的功能。特别是,ClassificationTree
和RegressionTree
接受随机选择的功能的数量,每个决定拆分为可选的输入参数。那是,treebagger
实现随机森林算法[1].
对于回归问题,treebagger
金宝app支持均值和分位数回归(即分位数回归森林)[2]).
为了预测平均响应或估计给定数据的均方误差,通过treebagger
模型和数据预测
或错误
, 分别。执行类似的操作,用于外袋观察,使用OOB预测
或oobError
.
为了估计响应分布的分位数或给定数据的分位数误差,通过atreebagger
模型和数据stanilepredict.
或quantileError
, 分别。执行类似的操作,用于外袋观察,使用oobQuantilePredict
或oobQuantileError
.
treebagger | 创造决策树 |
附加 |
添加新树到集合 |
紧凑的 |
决策树的紧集成 |
错误 |
误差(误分类概率或MSE) |
fillprox |
训练数据的接近矩阵 |
growTrees |
培训额外的树木并添加到Ensemble |
边缘 |
分类保证金 |
mdsprox. |
邻近矩阵的多维标度 |
meanMargin |
意思是分类保证金 |
oobError |
Out-of-bag错误 |
oobMargin |
现成的利润 |
Oobmeanmargin. |
袋子外平均值边缘 |
OOB预测 |
出袋观测的集合预测 |
oobQuantileError |
回归树袋外分位数损失 |
oobQuantilePredict |
分位式预测来自袋子回归树的袋子观测 |
partialDependence |
计算部分相关性 |
plotPartialDependence |
创建部分依赖绘图(PDP)和个人有条件期望(ICE)绘图 |
预测 |
利用套袋决策树集成预测响应 |
quantileError |
使用回归树包的分位数损失 |
stanilepredict. |
预测响应分位数使用袋回归树 |
|
包含响应变量的类名的单元格数组 |
|
一个逻辑标志,指定是否应该计算训练观察的包外预测。默认为 如果这个标志是
如果这个标志是
|
|
应计算指定是否应计算可变重要性外包估计的逻辑标志。默认为 如果这个标志是
|
|
方阵,在哪里 这个属性是:
|
|
返回的默认值
|
|
大小的数字数组1-by-据nvar将分割标准的变化通过每个变量的分割进行求和,并在整个已长成的树木集合中取平均值。 |
|
随机选择的观察结果的一部分,并替换每个引导副本。每个副本的大小为诺布× |
|
对于不降低总风险的拆分,是否合并具有相同父类的决策树叶子的逻辑标志。默认值为 |
|
树木使用的方法。可能的值是 |
|
每片树叶的最低观察次数。默认情况下, |
|
标量值等于集合中的决策树数。 |
|
大小的数字数组1-by-据nvar,其中每个元素给出了这个预测器上所有树的分割数。 |
|
为每个决策分割随机选择的预测值或特征变量的数量。默认情况下, |
|
逻辑阵列大小诺布——- - - - - -裸树,在那里诺布是培训数据中的观察数量和裸树为集合中树的数量。一个 |
|
数字大小数组诺布-by-1包含用于计算每次观测的袋外响应的树的数量。诺布为用于创建集合的训练数据中的观测数。 |
|
大小的数字数组1-by-据nvar包含每个预测变量(特征)的变量重要性度量。对于任何变量,如果该变量的值在出袋观测值中排列,则测量值为升高的边距数和降低的边距数之间的差值。该测量值针对每棵树进行计算,然后对整个集合进行平均,并除以整个集合的标准偏差。这对于回归树,属性为空。 |
|
大小的数字数组1-by-据nvar包含每个预测变量(特征)的重要性度量。对于任何变量,如果禁止袋外观察结果允许该变量的值,则测量值是预测误差的增加。对于每个树计算该措施,然后在整个集合上平均并除以整个集合的标准偏差。 |
|
大小的数字数组1-by-据nvar包含每个预测变量(特征)的重要性度量。对于任何变量,如果该变量的值在袋外观测值中排列,则度量值为分类裕度的减少。该度量值针对每棵树计算,然后在整个集合上求平均值,并除以整个集合上的标准偏差。对于回归树,此属性为空。 |
|
一个数字大小数组诺布-比1,在哪里诺布是训练数据中观察值的数量,包含每个观察值的异常值度量。 |
|
每个班级的先前概率的数字矢量。元素的顺序 这个属性是:
|
|
一个大小的数字矩阵诺布——- - - - - -诺布,在那里诺布是培训数据中的观察数,含有观察之间的接近度。对于任何两个观察,它们的接近被定义为这些观察结果在同一叶上的树木的一部分。这是一个对照矩阵,对角线和非对角线元件上的1S,范围为0到1。 |
|
这 |
|
一个逻辑标志,指定是否对每个具有替换的决策树进行数据采样。此属性 |
|
|
|
细胞阵列的大小裸树-1包含集合中的树木。 |
|
大小的矩阵据nvar——- - - - - -据nvar具有可变关联的预测措施,平均在成长树的整个整体上。如果你长大了集合设置 |
|
包含预测变量(特性)名称的单元格数组。 |
|
长度权值的数值向量诺布,在那里诺布是训练数据中的观察数(行)。 |
|
有大小的表格或数字矩阵诺布——- - - - - -据nvar,在那里诺布是观察数(行)和据nvar为训练数据中变量(列)的个数。如果你用一个预测值表来训练集合,那么 |
|
尺寸诺布响应数据数组 |
价值。要了解这如何影响您对类的使用,请参见比较句柄类和值类在MATLAB®面向对象的编程文档。
暂时treebagger
模型对象B.
, 这树木
属性存储的单元格向量B.NumTrees
CompactClassificationTree
或紧回归树
模型对象。用于树的文本或图形显示T.
在细胞载体中,输入
视图(B.Trees {t})
统计和机器学习工具箱™为袋装和随机森林提供三个物体:
有关差异之间的详细信息treebagger
以及袋装套装(分类BaggedAssemble
和RegressionBaggedEnsemble
),看TreeBagger和Bagged Sensembles的比较.
[1] 布莱曼,L.“随机森林。”机器学习45,页5-32,2001。
[2] Meinshausen, N.“分位数回归森林”机床学习研究,卷。7,2006,第983-999页。