文档

bootstrp

语法

Bootstat = bootstrap (nboot,bootfun,d1,…)
[bootstat,bootsam] = bootstrap(…)
Bootstat = bootstrap(…,“名字”价值

描述

Bootstat = bootstrap (nboot,bootfun,d1,…)吸引了nboot引导数据样例,计算每个样例的统计信息bootfun,并返回矩阵中的结果bootstatnboot必须是正整数。bootfun是否指定了函数句柄@.每一行bootstat包含应用的结果bootfun到一个bootstrap样本。如果bootfun返回矩阵或数组,然后将此输出转换为行向量以存储其中bootstat

第三个和后面的输入参数(d1,……)是用于创建输入的数据(标量、列向量或矩阵)bootfunbootstrp通过对非标量数据参数的行进行替换进行采样(这些行必须具有相同的行数),创建每个引导样例。bootfun接受标量数据不变。

[bootstat,bootsam] = bootstrap(…)返回一个n——- - - - - -nboot引导索引矩阵,bootsam.的每一栏bootsam包含从原始数据集中提取的值的索引,这些值构成相应的引导样本。例如,如果d1,……每个包含16个值,和Nboot = 4,然后bootsam是一个16 × 4矩阵。第一列包含从中提取的16个值的索引d1,……,对于四个引导示例中的第一个,第二列包含四个引导示例中的第二个的索引,依此类推。(引导索引对于所有输入数据集都是相同的。)来获取输出样本bootsam不应用函数,集合bootfun清空([]).

Bootstat = bootstrap(…,“名字”价值使用由一个或多个参数指定的附加参数名称,值对参数。名称-值对必须出现在数据参数之后。可用的名称-值对:

  • “重量”-观察权重。的权重Value必须是包含至少一个正数元素的非负数向量。元素的数量权重必须等于非标量输入参数中的行数bootstrp.要获得一个引导复制,bootstrp样品NN用这些权重作为多项抽样概率进行替换。

  • “选项”-该值是一个结构,包含指定是否并行计算引导迭代的选项,以及指定如何在引导采样期间使用随机数。创建选项结构statset.适用的statset参数:

    • “UseParallel”——如果真正的如果parpool的并行计算工具箱™是开放的,并行计算引导迭代。如果没有安装“并行计算工具箱”,或者parpool未打开,则以串行模式进行计算。默认是,即串行计算。

    • UseSubstreams—设置为真正的并行计算以可重复的方式并行计算默认是.要重复计算,设置转换为允许子流的类型:“mlfg6331_64”“mrg32k3a”

    • ——一个RandStream对象或此类对象的单元格数组。如果不指定bootstrp使用默认流或多个流。如果您选择指定,除case外,使用单个宾语

      • 你有一个开放的平行池

      • UseParallel真正的

      • UseSubstreams

      在这种情况下,使用与Parallel池相同大小的单元格数组。

例子

全部折叠

这个例子展示了如何使用样本数据的自举重采样计算相关系数标准误差。

加载包含15名学生的LSAT分数和法学院GPA的数据集。这15个数据点被重新采样,以创建1000个不同的数据集,并为每个数据集计算两个变量之间的相关性。

负载lawdatarng默认的%用于重现性[bootstat, boottsam] = bootstrap (1000,@corr,lsat,gpa);

显示前5个自引导相关系数。

: bootstat (1:5)
Ans = 0.9874 0.4918 0.5459 0.8458 0.8959

显示为前5个引导样例选择的数据的索引。

Bootsam(:,1:5)图直方图(bootstat)
Ans = 13 3 11 8 12 14 7 1 7 4 2 14 5 10 8 14 12 1 11 11 10 15 2 12 14 2 10 13 5 15 5 1 11 11 9 9 13 5 10 3 15 15 5 1 11 11 9 9 13 5 10 3 15 15 3 3 15 11 12 4 3 12 7 8 13 15 12 6 15 4 6 6 6 13 8 10 12 9 4 13 3 3 4 14

直方图显示了所有bootstrap样本的相关系数的变化。样本最小值为正,说明LSAT分数与GPA之间的关系不是偶然的。

最后,计算估计相关系数的自举误差标准。

Se = std(bootstat)
Se = 0.1285

这个例子展示了如何估计引导均值的核密度。

计算从向量Y取的100个随机样本的引导平均值的样本。

rng默认的%用于重现性Y = expnd (5,100,1);M = bootstrap (100,@mean,y);

画出这些自举均值的估计密度。

图;[fi,xi] = ksdensity(m);情节(xi, fi);

这个例子展示了如何计算和绘制从一个数据向量引导的100个样本的平均值和标准差。

计算从向量中取的100个随机样本的引导均值和标准差的样本y

rng默认的%用于重现性Y = expnd (5,100,1);Stats = bootstrap (100,@(x)[mean(x) std(x)],y);

绘制引导估计对。

情节(统计(:1),数据(:,2),“o”

这个例子展示了如何通过自举残差来估计线性回归中系数向量的标准误差。

加载样例数据。

负载哈尔德

执行线性回归并计算残差。

X = [ones(大小(热度)),配料];Y =热量;B =回归(y,x);Yfit = x*b;渣滓= y - yfit;

通过自举残差估计标准误差。

Se = std(bootstrap)...1000年,@ (bootr)回归(yfit + bootr, x)渣油))
Se = 56.1752 0.5940 0.5815 0.5989 0.5691

R2006a之前介绍过

这个话题有帮助吗?