主要内容

bootci

引导置信区间

描述

例子

ci= bootci (nbootbootfund计算由该函数计算的每个统计量的95%引导置信区间bootfun。的bootci功能使用nbootBootstrap样本的计算,并创建每个Bootstrap样本的抽样与替换从行的d

例子

ci= bootci (nbootbootfund1,......,dñ)通过从非标量数据参数的行中进行抽样和替换,创建每个引导程序示例d1,…,dN。这些非卡尔参数必须具有相同数量的行。的bootci函数将非标量数据的样本和未改变的标量数据参数传入d1,…,dNbootfun

例子

ci= bootci (nboot,{bootfund},名称,值使用一个或多个名称-值参数指定选项。属性可以更改置信区间的类型“类型”名称-值参数。

请注意,您必须通过bootfund争论到bootci作为单个单元数组。

例子

ci= bootci (nboot,{bootfund1,......,dN},名称,值使用一个或多个名称-值参数指定选项。例如,可以通过指定置信区间的显著性级别'Α'名称-值参数。

请注意,您必须通过bootfund1,…,dN争论到bootci作为单个单元数组。

例子

(cibootstat) = bootci (___还返回为每个计算的引导统计数据nboot引导程序复制示例,使用前面语法中的任何输入参数组合。每一排bootstat包含应用的结果bootfun到一个引导样例。

例子

全部收缩

计算统计过程控制能力指标的置信区间。

从均值为1,标准差为1的正态分布中生成30个随机数。

RNG(“默认”%的再现性y = normrnd(1, 1, 30岁,1);

指定工艺的规格下限和上限。定义能力索引。

LSL = 3;USL = 3;= @ (x)能力(USL-LSL)。/(6 *性病(x));

利用2000个自助样本计算能力指数的95%置信区间。默认情况下,bootci采用偏差修正加速百分位法构造置信区间。

ci = bootci(2000,有能力,y)
ci =2×10.5937 - 0.9900

计算能力指数的学习置信区间。

sci = bootci(2000年{能力,y},“类型”“学生”
sci =2×10.5193 0.9930.

计算非线性回归模型系数的引导置信间隔。在该示例中使用的技术涉及引导预测器和响应值,并假设预测器变量是随机的。对于假设预测器变量的技术是固定并引导残差的技术,请参阅线性回归模型系数的Bootstrap置信区间

笔记:这个示例使用nlinfit(当您只需要非线性回归模型的系数估计或残差时,它很有用,并且您需要重复拟合模型多次,如在自动启动的情况下。如果您需要进一步调查拟合的回归模型,请通过使用创建非线性回归模型对象fitnlm。属性可以为结果模型的系数创建置信区间coefCI对象函数,尽管此函数不使用引导。

从非线性回归模型中生成数据 y b 1 + b 2 e x p - b 3. x + ϵ ,在那里 b 1 1 b 2 3. , 和 b 3. 2 是系数;预测器变量x呈指数分布,均值为2;误差项 ϵ 通常以平均值0分布和标准偏差0.1。

modelfun = @(b,x)(b(1)+ b(2)* exp(-b(3)* x));RNG(“默认”%的再现性b = [1; 3; 2);x = exprnd (2100 1);Y = modelfun(b,x) + normrnd(0, 0.1100,1);

为使用中初始值的非线性回归模型创建函数句柄Beta0.

beta0 = (2; 2; 2);β= @(预测、响应)nlinfit(预测、响应modelfun beta0)
β=function_handle具有值:@(预测、响应)nlinfit(预测、响应modelfun beta0)

计算非线性回归模型系数的95% bootstrap置信区间。根据生成的数据创建引导示例xy

ci = bootci(1000年,β,x, y)
ci =2×30.9821 2.9552 2.0180 1.0410 3.1623 2.2695

前两个置信区间包括真实的系数值 b 1 1 b 2 3. ,分别。然而,第三个置信区间不包括真正的系数值 b 3. 2

现在计算模型系数的99% bootstrap置信区间。

newci = bootci(1000年,{β,x, y},'Α', 0.01)
newci =2×30.9730 2.9112 1.9562 1.0469 3.1876 2.3133

所有三个置信区间都包含了真实的系数值。

计算bootstrap置信区间的系数的线性回归模型。本例中使用的技术涉及自举残差,并假设预测变量是固定的。对于假定预测变量是随机的并自举预测变量和响应值的技术,请参见非线性回归模型系数的引导置信区间

笔记:这个示例使用回归,当您只需要一个回归模型的系数估计或残差,并且您需要重复拟合一个模型多次时,这是有用的,就像在bootstrapping的情况。如果需要进一步研究拟合的回归模型,可以使用fitlm。属性可以为结果模型的系数创建置信区间coefCI对象函数,尽管此函数不使用引导。

加载样本数据。

负载哈尔德

执行线性回归并计算残差。

x =[(大小(热)),成分);y =热量;b =回归(y、x);yfit = x * b;Resid = y - yfit;

计算线性回归模型系数的95% bootstrap置信区间。从残余物中创建bootstrap样本。通过指定,使用带有自举偏差和标准误差的正态逼近区间“类型”、“正常”。在这种情况下,不能使用默认置信区间类型。

ci = bootci(1000,{@(bootr)回归(yfit + bootr,x),star},......“类型”“正常”
ci =2×5-47.7130 0.3916 -0.6298 -1.0697 -1.2604 172.4899 2.7202 1.6495 1.2778 0.9704

绘制估计系数b,省略截距术语,并显示显示系数置信区间的误差条。

斜坡= B(2:结束)';Dublubrlengths = Slopes-Ci(1,2:结束);upperbarlengths = ci(2,2:end)-slopes;errorbar(1:4,斜坡,updarbarlengs,upperbarlengths)xlim([0 5])标题(系数的置信区间的

图中包含一个轴。带有系数置信区间的轴包含一个类型为errorbar的对象。

只有第一个非截距系数与0有显著差异。

计算100个自助样本的平均值和标准偏差。找出每个统计量的95%置信区间。

从指数分布产生100个随机数,平均值5。

RNG(“默认”%的再现性y = exprnd (5100 1);

从向量中抽取100个bootstrap样本y。对于每个自助样本,计算平均值和标准偏差。找到均值和标准差的95%引导置信区间。

(ci, bootstat) = bootci(100年,@ (x)(意思是(x)性病(x)), y);

ci (: 1)包含平均置信区间的下界和上界,以及C(:,2)包含标准偏差置信区间的下限和上限。每一排bootstat包含自助样本的平均值和标准偏差。

绘制每个自助样本的均值和标准差作为一个点。绘制均值置信区间的下界和上界为垂直线虚线,绘制标准差置信区间的下界和上界为水平线虚线。

情节(bootstat (: 1) bootstat (:, 2),“o”)Xline(CI(1,1),':')参照线(ci (2, 1),':')Yline(CI(1,2),':') yline (ci (2, 2),':')xlabel(“的意思是”)ylabel('标准偏差'

图中包含一个轴。坐标轴包含5个对象,类型分别为line和constantline。

输入参数

全部收缩

绘制的引导样本数量,指定为正整数标量。要创建每个引导样本,bootci随机选择和替换n出了n中的非标量数据行d或者d1,…,dN

例子:100.

数据类型:|

应用于每个样本的功能,指定为函数句柄。该函数可以是自定义或内置功能。您必须指定bootfun与之象征。

例子:@mean

数据类型:function_handle

要抽样的数据,指定为列向量或矩阵。的nd对应于观测。当您使用多个数据输入参数时d1,…,dN,您可以将一些参数指定为标量值,但所有非卡尔参数必须具有相同数量的行。

如果使用单个向量参数d,您可以将其指定为行向量。bootci然后来自载体的元素的样品。

数据类型:|

名称值对参数

指定可选的逗号分隔对名称,值参数。的名字参数名和价值是相应的价值。的名字必须出现在引号内。您可以以任何顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:bootci(100年,{@mean, 1:6”},“阿尔法”,0.1)指定从值1到值6抽取100个bootstrap样本,取每个样本的平均值,然后计算样本平均值的90%置信区间。

显著性水平,指定为0到1之间的正标量。bootci计算100 *(1-alpha)函数定义的每个统计数据的引导置信区间bootfun

例子:'alpha',0.01

数据类型:|

置信区间类型,指定为此表中的值之一。

价值 描述
“规范”或者“正常” 正常近似间隔,带有自动绑定偏差和标准错误[1]
“每”或者“百分比” 基本百分位方法
'COL'或者“纠正百分位” 偏差修正百分位法[2]
“bca”

偏差修正和加速百分位法[3][4]——是一种z0使用bootstrap值小于原始样本值的比例计算的因子。当样本是块状时,为了产生合理的结果,软件进行计算z0通过包含与原始样本值相同的引导值的一半。

“学生”或者“学生” Studentized置信区间[3]

例子:“类型”,“学生”

所研究的标准误差估计的自助样本数,指定为一个正整数标量。

bootci计算函数定义的统计的学生化引导置信区间bootfun,并对bootstrap统计量的标准误差进行估计NBootStd引导数据样本。

请注意

要使用此名称-值参数,请使用类型价值必须是“学生”或者“学生”。指定NBootStd或者StdErr但不是两者都要。

例子:“NBootStd”,50岁

数据类型:|

用于计算已学过的标准误差估计值的函数,指定为函数句柄。

bootci计算函数定义的统计的学生化引导置信区间bootfun,利用该函数估计bootstrap统计量的标准误差StdErr。的StdErr函数的参数必须与bootfun并返回计算的统计量的标准误差bootfun

请注意

要使用此名称-值参数,请使用类型价值必须是“学生”或者“学生”。指定NBootStd或者StdErr但不是两者都要。

例子:'stderr',@ std

数据类型:function_handle

观测权值,指定为具有至少一个正元素的非负向量。中元素的个数权重必须等于行数n在数据中d或者d1,…,dN。要获得一个bootstrap样本,bootci随机选择和替换nn使用这些权重作为多项抽样概率的数据行。

数据类型:|

在Bootstrap采样期间并行计算自动启动迭代的选项,并将其设置为结构。创造选项结构statset。此表列出了选项字段及其值。

字段名 价值 默认
UseParallel 将此值设置为真的并行计算Bootstrap迭代。
UseSubstreams

将此值设置为真的以可重复的方式并行地运行计算。

要重复计算,设置到允许子流的类型:'mlfg6331_64'或者“mrg32k3a”

将此值指定为RandStream这些对象的对象或小区阵列。除了何时之外,使用单个对象UseParallel价值是真的UseSubstreams价值是。在这种情况下,使用具有与并行池相同大小的单元数组。 如果不指定,然后bootci使用默认流或流。

请注意

您需要并行计算工具箱™并行运行计算。

例子:“选项”,statset (UseParallel,真的)

数据类型:结构体

输出参数

全部收缩

置信区间界限,作为矢量,矩阵或具有两行的多维数组返回。

  • 如果bootfun然后返回一个标量ci是一个包含置信区间下界和上界的向量。

  • 如果bootfun返回长度向量,然后ci矩阵的大小是2乘-吗,在那里: ci (1)是下限和: ci (2)上界。

  • 如果bootfun然后返回一个多维数组ci是一个数组,在哪里ci(1:…)是一系列下限和ci(2:…)是一个上界数组。

引导统计信息,以列向量或矩阵的形式返回nboot行。的th排bootstat对应于申请结果bootfun到了th bootstrap样本。如果bootfun返回矩阵或数组,然后是bootci功能首先将此输出转换为行向量,然后再存储bootstat

参考文献

A. C.戴维森,D. V.欣克利。引导方法及其应用程序。剑桥大学出版社,1997。

[2]埃夫隆,布拉德利。折刀,引导和其他重采样计划。费城:工业和应用数学协会,1982年。

[3] Diciccio,Thomas J.和Bradley Efron。“引导置信区间。”统计科学11日,没有。3(1996): 189 - 228。

[4] efron,布拉德利和罗伯特J. Tibshirani。Bootstrap简介。纽约:查普曼和霍尔出版社,1993年。

扩展功能

介绍了R2006a