决策树包
TreeBagger
将决策树集合用于分类或回归。Bagging代表引导聚合。集合中的每棵树都是在输入数据的独立绘制的引导副本上生长的。不包括在这个副本中的观察结果对于这个树来说是“out of bag”。
TreeBagger
依靠分类树
和回归树
生长单独的树的功能。特别是,分类树
和回归树
接受为每个决策分割随机选择的特性数量作为可选输入参数。也就是说,TreeBagger
实现了随机森林算法[1].
对于回归问题,TreeBagger
金宝app支持均值和分位数回归(即分位数回归)[2])。
要预测平均响应或估计给定数据的均方误差,请传递TreeBagger
模型和数据预测
或错误
,分别。要对袋外观察执行类似的操作,请使用OOB预测
或oobError
.
为了估计响应分布的分位数或给定数据的分位数误差,通过aTreeBagger
模型和数据quantilePredict
或定量误差
,分别。要对袋外观察执行类似的操作,请使用oobQuantilePredict
或oobQuantileError
.
TreeBagger | 创建决策树包 |
附加 |
将新树附加到集合中 |
契约 |
决策树的紧集成 |
错误 |
误差(误分类概率或MSE) |
fillprox |
训练数据的邻近矩阵 |
种树 |
训练额外的树,并添加到整体 |
边缘 |
分类保证金 |
mdsprox |
邻近矩阵的多维标度 |
平均边际 |
平均分类边际 |
oobError |
出包错误 |
oobMargin |
现成的利润 |
oobMeanMargin |
Out-of-bag意味着利润 |
OOB预测 |
出袋观测的集合预测 |
oobQuantileError |
回归树袋外分位数损失 |
oobQuantilePredict |
从回归树的袋外观察的分位数预测 |
partialDependence |
计算部分相关性 |
局部依赖 |
创建部分依赖图(PDP)和个人条件期望图(ICE) |
预测 |
利用套袋决策树集成预测响应 |
定量误差 |
使用回归树包的分位数损失 |
quantilePredict |
预测响应分位数使用袋回归树 |
|
包含响应变量的类名的单元格数组 |
|
一个逻辑标志,指定是否应该计算训练观察的包外预测。默认值是 如果这个标志是
如果这个标志是
|
|
一个逻辑标志,指定是否应该计算变量重要性的包外估计。默认值是 如果这个标志是
|
|
方阵,在哪里 这个属性是:
|
|
由返回的默认值
|
|
大小为1 × -的数字数组Nvars将分割标准的变化通过每个变量的分割进行求和,并在整个已长成的树木集合中取平均值。 |
|
随机选择的观察结果的一部分,并替换每个引导副本。每个副本的大小为诺布× |
|
对于不降低总风险的拆分,是否合并具有相同父类的决策树叶子的逻辑标志。默认值为 |
|
树木使用的方法。可能的值是 |
|
每片树叶的最低观察次数。默认情况下, |
|
集合中等于决策树数目的标量值。 |
|
大小为1 × -的数字数组Nvars,其中每个元素在所有树上求和的该预测器上给出若干个拆分。 |
|
为每个决策分割随机选择的预测值或特征变量的数量。默认情况下, |
|
逻辑阵列大小诺布-借-裸树哪里诺布训练数据中的观察数和裸树为集合中树的数量。一个 |
|
大小数字数组诺布-by-1,包含用于计算每次观察的袋外响应的树数。诺布是用于创建集合的训练数据中的观察数。 |
|
大小为1 × -的数字数组Nvars包含每个预测变量(特征)的变量重要性度量。对于任何变量,如果该变量的值在出袋观测值中排列,则测量值为升高的边距数和降低的边距数之间的差值。该测量值针对每棵树进行计算,然后对整个集合进行平均,并除以整个集合的标准偏差。这对于回归树,属性为空。 |
|
大小为1 × -的数字数组Nvars包含每个预测变量(特征)的重要性度量。对于任何一个变量,如果该变量的值是在袋子外的观察值中排列的,则度量是预测误差的增加。对每棵树计算这个度量,然后在整个集合上取平均值,再除以整个集合上的标准差。 |
|
大小为1 × -的数字数组Nvars包含每个预测变量(特征)的重要性度量。对于任何变量,如果该变量的值在袋外观测值中排列,则度量值为分类裕度的减少。该度量值针对每棵树计算,然后在整个集合上求平均值,并除以整个集合上的标准偏差。对于回归树,此属性为空。 |
|
有大小的数字数组诺布-比1,在哪里诺布是训练数据中观察值的数量,包含每个观察值的异常值度量。 |
|
每个类的先验概率的数字向量。元素的顺序 这个属性是:
|
|
有大小的数字矩阵诺布-借-诺布哪里诺布为训练数据中的观测数,包含观测值之间的接近度度量值。对于任意两个观测值,它们的接近度定义为这些观测值落在同一片叶子上的树木的比例。这是一个对称矩阵,对角线和非对角线上的元素从0到1都有1s。 |
|
的 |
|
一个逻辑标志,指定是否对每个决策树的数据进行采样并进行替换。此属性为 |
|
的单元格数组参数 |
|
大小相同的单元格数组裸树-by-1包含集合中的树。 |
|
大小矩阵Nvars-借-Nvars通过变量关联的预测措施,对整个成年树木进行平均。如果你增加了布景 |
|
包含预测变量(特性)名称的单元格数组。 |
|
长度权重的数值向量诺布哪里诺布是训练数据中的观察数(行)。 |
|
大小的表格或数字矩阵诺布-借-Nvars哪里诺布是观察数(行)和Nvars为训练数据中变量(列)的个数。如果你用一个预测值表来训练集合,那么 |
|
一个大小诺布响应数据数组 |
价值。要了解这如何影响您对类的使用,请参见比较句柄类和值类在MATLAB中®面向对象编程的文档。
暂时TreeBagger
模型对象B
,树
属性存储的单元格向量B.NumTrees
CompactClassificationTree
或紧回归树
模型对象。用于树的文本或图形显示t
在单元向量中,输入
视图(B.Trees{t})
Statistics and Machine Learning Toolbox™提供了三种对象用于套袋和随机森林:
详细了解两者的区别TreeBagger
以及袋装套装(分类BaggedAssemble
和RegressionBaggedEnsemble
),见套袋式和套袋式的比较.
[1] 布莱曼,L.“随机森林。”机器学习45,页5-32,2001。
[2] 分位数回归森林机器学习研究杂志,第7卷,2006年,第983-999页。