主要内容

OOBQUANTILEPREDICT

班级:treebagger

从袋子袋袋中观测到回归树的分量预测

描述

例子

YFIT.= OOBQUANTILEPREDICT(MDL.返回所有预测响应的中位数的向量bag观察mdl.x.,预测器数据和使用MDL.,这是一袋回归树。MDL.必须是A.treebagger模型对象和mdl.oobindices.必须是不懈的。

例子

YFIT.= OOBQUANTILEPREDICT(MDL.名称,价值使用一个或多个指定的其他选项名称,价值对论点。例如,指定分位式概率或树以包括定量估计。

例子

[YFIT.yw.] = OOBQUANTILEPREDICT(___也返回稀疏矩阵响应权重使用以前的任何语法。

输入参数

展开全部

一袋回归树,指定为atreebagger模型对象创建treebagger

  • 的价值mdl.method.一定是回归

  • 当你训练MDL.使用treebagger,您必须指定名称值对'Oobprediction','开'。最后,treebagger保存所需的袋子外观察指标矩阵mdl.oobindices.

名称值对参数

指定可选的逗号分离对名称,价值论点。名称是参数名称和价值是相应的价值。名称必须出现在引号内。您可以以任何顺序指定多个名称和值对参数name1,value1,...,namen,valuen

分位数概率,指定为逗号分隔的配对'standile'和一个包含间隔中值的数字矢量[0,1]。对于每个观察(行)mdl.x.OOBQUANTILEPREDICT估计所有概率的相应量程斯蒂利韦

例子:'stantile',[0 0.25 0.5 0.75 1]

数据类型:单身的|双倍的

在响应估计中使用的树木指标,指定为包括的逗号分隔对'树木''全部'或正整数的数字矢量。索引对应于细胞mdl.trees.;其中的每个单元格都包含在集合中的树。最大值树木必须小于或等于合奏中的树木数量(mdl.numtrees.)。

为了'全部'OOBQUANTILEPREDICT使用索引1:mdl.numtrees.

例子:'树木',[1 10 mdl.numtrees]

数据类型:char|细绳|单身的|双倍的

权重属于各个树木的响应,​​指定为逗号分隔的对'treeweights'和一个数字矢量numel(树木非负值。树木是值的价值树木名称值对参数。

默认为那些(大小(树木)))

数据类型:单身的|双倍的

输出参数

展开全部

估计的袋袋观测量数,作为一个返回N-经过-numel(TAU数字矩阵。N是培训数据中的观测数量(numel(mdl.y)) 和TAU是值的价值斯蒂利韦名称值对参数。那是,YFIT(jK.是估计的100 *TAUK.给出的响应分配的百分位数X(j,:)并使用MDL.

响应权重,返回一个N-经过-N稀疏矩阵。N是培训数据中的响应数量(numel(mdl.y))。yw(:,j指定观察的响应权重mdl.x(j,:)

OOBQUANTILEPREDICT使用经验累积分布函数(CDF)的线性插值来预测定量。对于特定的观察,您可以使用其响应权重来使用替代方法来估计定量,例如近似CDF使用内核平滑

例子

展开全部

加载Carsmall.数据集。考虑一种模型,该模型在鉴于其发动机位移给出汽车的燃料经济性(以MPG)。

加载Carsmall.

使用整个数据集培训袋装回归树的集合。指定100名弱学习者并保存出袋子索引。

RNG(1);重复性的%mdl = treebagger(100,位移,mpg,'方法''回归'......'Oobprediction''上');

MDL.是A.treebagger合奏。

执行量级回归以预测所有培训观察的袋装中位燃料经济性。

Oobmedianmpg = OOBQUANTILEPREDICT(MDL);

Oobmedianmpg.是一个N- 给出了对应于响应的条件分布的中位数的1个数字矢量给出了分类的观察mdl.x.N是观察的数量,尺寸(mdl.x,1)

按升序对观察进行排序。绘制同一个数字的观察和估计的中位数。比较袋子外中位数和平均反应。

[sx,idx] = sort(mdl.x);Oobmeanmpg = Oobpredict(MDL);数字;情节(位移,MPG,'k。');抓住图(SX,OOBMEDIANMPG(IDX));绘图(SX,OobmeAnmpg(IDX),'r--');ylabel('燃油经济');Xlabel('发动机排量');传奇('数据''袋子中位数''袋子意味着');抓住离开;

加载Carsmall.数据集。考虑一种模型,该模型预测汽车(MPG)的燃料经济性给出其发动机位移。

加载Carsmall.

使用整个数据集培训袋装回归树的集合。指定100名弱学习者并保存出袋子索引。

RNG(1);重复性的%mdl = treebagger(100,位移,mpg,'方法''回归'......'Oobprediction''上');

执行量级回归以预测袋子外的2.5%和97.5%百分比。

OOBQUANTPREDINTS = OOBQUANTILEPREDICT(MDL,'standile',[0.025,0.975]);

Oobquantpredints.是一个N-2-2数值矩阵对应于袋外观察的预测间隔mdl.x.N是观察人数,尺寸(mdl.x,1)。第一列包含2.5%百分比,第二列包含97.5%百分位数。

绘制同一个数字的观察和估计的中位数。比较百分点预测间隔和95%的预测间隔,假设条件分布MPG.是高斯。

[Oobmeanmpg,OobstealeAnmpg] = Oobpredict(MDL);STDNPREDINTS = OOBMEANMPG + [-1 1] * NORMINV(0.975)。* OOBSTEMEANMPG;[sx,idx] = sort(mdl.x);数字;H1 =图(位移,MPG,'k。');抓住h2 = plot(sx,oobquantpredints(idx,:),'B');h3 = plot(sx,stdnpredints(idx,:),'r--');ylabel('燃油经济');Xlabel('发动机排量');图例([H1,H2(1),H3(1)],{'数据''95%百分位预测间隔'......'95%高斯预测间隔'});抓住离开;

加载Carsmall.数据集。考虑一种模型,该模型预测汽车(MPG)的燃料经济性给出其发动机位移。

加载Carsmall.

使用整个数据集培训袋装回归树的集合。指定100个弱的学习者并保存禁止外索引。

RNG(1);重复性的%mdl = treebagger(100,位移,mpg,'方法''回归'......'Oobprediction''上');

估计禁止袋响应权重。

[〜,YW] = OOBQUANTILEPREDICT(MDL);

yw.是包含响应权重的N-by n稀疏矩阵。N是培训观察的数量,numel(y)。观察的响应权重mdl.x(j,:)yw(:,j)。响应权重独立于任何指定的分位式概率。

估计答复的袋子外,条件累积分配函数(CCDF):

  1. 排序响应是升序顺序,然后使用通过对响应进行排序引起的索引来排序响应权重。

  2. 计算排序响应权重的每列上的累积和。

[sorty,sortidx] = sort(mdl.y);cpdf = full(yw(sortIdx,:));ccdf = cumsum(cpdf);

CCDF(:,j)是响应的经验外禁止CCDF,给予观察j

选择四种培训观察的随机样本。绘制训练样本并确定所选的观察。

[randx,IDX] =数据征(MDL.x,4);数字;绘图(mdl.x,mdl.y,'o');抓住绘图(RANDX,MDL.Y(IDX),'*''Markersize',10);文本(RANDX-10,MDL.Y(IDX)+1.5,{'Obs。1''Obs。2''Obs。3''Obs。4'});传奇('培训数据''选择观察');Xlabel('发动机排量')ylabel('燃油经济') 抓住离开

为同一图中的四个所选响应绘制袋子外CCDF。

数字;绘图(Sorty,CCDF(:,IDX));传奇('CCDF给予OBS。1''CCDF给予OBS。2'......'CCDF给予OBS。3''CCDF给予OBS。4'......'地点''东南') 标题('袋不良条件累积分配功能')xlabel('燃油经济')ylabel('经验CDF'

更多关于

展开全部

算法

OOBQUANTILEPREDICT通过申请估计袋子超定量standilepredict.致培训数据的所有观察(mdl.x.)。对于每个观察,该方法仅使用观察袋的树木。

对于在集合中所有树木的袋子的观察,OOBQUANTILEPREDICT分配响应数据的样本量级。换句话说,OOBQUANTILEPREDICT不使用量子回归进行袋袋的观察。相反,它分配smianile(mdl.y,TAU, 在哪里TAU是值的价值斯蒂利韦名称值对参数。

参考

[1] Meinshausen,N。“斯蒂利回归森林。”机床学习研究,卷。7,2006,第983-999页。

[2] Breiman,L。“随机森林。”机器学习。卷。45,2001,第5-32页。

介绍在R2016B.