主要内容

oobQuantileError

类:TreeBagger

回归树袋外分位数损失

描述

例子

犯错=量化误差(Mdl返回一半的现成的中比较真实响应的平均绝对偏差(MAD)Mdl.Y到预测的,超出预期的中位数Mdl.X,预测数据,并使用回归树包MdlMdl必须是一个TreeBagger模型对象。

例子

犯错=量化误差(Mdl名称,值使用一个或多个指定的附加选项名称,值对参数。例如,指定分位数概率、错误类型,或者在分位数回归错误估计中包括哪些树。

输入参数

全部展开

回归树包,指定为TreeBagger由创建的模型对象TreeBagger

  • 的价值Mdl。方法必须回归

  • 当你训练Mdl使用TreeBagger,则必须指定名称-值对“OOBPrediction”,“上”因此TreeBagger保存所需的袋外观察指标矩阵Mdl。OOBIndices

名称-值对的观点

指定可选的逗号分隔的对名称,值论据。名称参数名和价值为对应值。名称必须出现在引号内。可以以任意顺序指定多个名称和值对参数名称1,值1,…,名称,值

集合错误类型,指定为逗号分隔对,由“模式”和表中的一个值。假设的价值分位数

价值 描述
“累积”

犯错是一个千里光-借-元素个数(累积分位数回归误差的数值矩阵。错误(jkk分位数回归误差使用的学习者在Mdl.树(1:j只有。

“合奏”

犯错是1 -元素个数(整个集合的累积分位数回归误差的数值向量。错误(kk集成分位数回归错误。

“个人”

犯错是一个千里光-借-元素个数(个体学习者分位数回归误差的数值矩阵。错误(jkk分位数回归误差使用学习者Mdl.树(j只有。

“累积”“个人”,如果选择在分位数估计中使用较少的树,则此操作将影响进入的行数犯错以及相应的行索引。

例子:“模式”、“累积”

分位数概率,指定为逗号分隔对分位数的以及一个数值向量,其中包含[0,1]区间内的值。对于中的每个观察值(行)Mdl.XoobQuantileError中所有概率的对应分位数估计分位数

例子:'分位数',[0 0.25 0.5 0.75 1]

数据类型:仅有一个的|双重的

用于响应估计的树索引,指定为逗号分隔对,由“树”“所有”或正整数的数字向量。索引对应于Mdl.树; 其中的每个单元包含集合中的一棵树。最大值必须小于或等于集合中的树数(千里光).

“所有”oobQuantileError使用集合中的所有树(即索引1: Mdl。NumTrees).

默认值以外的值可能会影响中的行数犯错

例子:“树”,[1 10 Mdl。NumTrees]

数据类型:烧焦|一串|仅有一个的|双重的

来自各个树的响应的权重,指定为逗号分隔的对,由“TreeWeights”和一个数值向量元素个数(非负值。的价值

如果您指定“模式”,“个人”,然后oobQuantileError忽略了TreeWeights

数据类型:仅有一个的|双重的

输出参数

全部展开

袋子里的一半分位数回归误差,作为数字标量或返回T-借-元素个数(矩阵的价值分位数

T取决于模式,分位数.假设你指定分位数,“树”,

  • “模式”、“累积”犯错是一个元素个数(-借-元素个数(数字矩阵。错误(jkk使用中的学习者的累积、出袋分位数回归误差Mdl.树((1:j))

  • “模式”、“合奏”犯错是一个1-借-元素个数(数值向量。错误(kk使用中的学习者的累积、出袋分位数回归误差Mdl.树(

  • “模式”,“个人”犯错是一个元素个数(-借-元素个数(数字矩阵。错误(jkkout- bag分位数回归误差Mdl.树(j))

例子

全部展开

加载carsmall考虑发动机的排量、重量和气缸数量,考虑一个预测汽车燃油经济性的模型。圆筒分类变量。

负载carsmall气缸=分类(缸);X =表(位移、重量、汽缸、MPG);

使用整个数据集训练一组袋装回归树。指定100名弱学习者并保存袋外索引。

rng (1);%为了再现性Mdl=TreeBagger(100,X,“英里”“方法”“回归”“OOB预测”“上”);

Mdl是一个TreeBagger合奏。

执行分位数回归,并使用预测的条件中位数估计整个集合的MAD。

oobErr = oobQuantileError (Mdl)
oobErr=1.5349

oobErr是整个集合分位数回归误差的无偏估计。

加载carsmall数据集。考虑一个模型,该模型可以预测给定发动机排量、重量和汽缸数量的汽车的燃油经济性。

负载carsmallX =表(位移、重量、汽缸、MPG);

使用整个数据集训练套袋回归树的集合。指定250个弱学习者并保存带外索引。

rng (“默认”);%为了再现性Mdl=TreeBagger(250,X,“英里”“方法”“回归”...“OOB预测”“上”);

估计累积的、现成的、0.25、0.5和0.75分位数回归误差。

err=oobQuantileError(Mdl,分位数的(0.25 0.5 0.75),“模式”“累积”);

犯错是一个250 × 3的累积,包外,分位数回归错误矩阵。列对应分位数概率,行对应集合中的树。这些错误是累积的,所以它们合并了以前树的聚合预测。

在同一图上绘制累积的、包外的分位数错误。

图;情节(错);传奇(“0.25分位数错误”“0.5分位数误差”“0.75分位数错误”); 伊拉贝尔(“Out-of-bag分位数错误”);包含(“树指数”);标题('累计、出袋、分位数回归误差'

训练大约50棵树后,所有分位数误差曲线都趋于平稳。因此,训练50棵树似乎足以实现三个分位数概率的最小分位数误差。

更多关于

全部展开

提示

包外集成误差估计器对于真集成误差是无偏的。因此,为了调整随机森林的参数,估计包外集成误差,而不是实现交叉验证。

参考文献

[1] Breiman, L。随机森林。机器学习45,pp. 5-32, 2001。

[2] 分位数回归森林机器学习研究杂志,第7卷,2006年,第983-999页。

介绍了R2016b