主要内容

选择一个样本大小

这个例子展示了如何确定样本的数量或观测需要进行统计检验。这说明了一个简单的样本大小的计算问题,然后展示了如何使用sampsizepwr函数计算能力和样本大小两个更现实的问题。最后,它说明了统计和机器学习的使用工具箱™函数来计算所需的样本容量测试sampsizepwr功能不支持。金宝app

测试一个正常的平均值与已知的标准偏差,片面的

介绍一些概念,让我们考虑一个不切实际的简单的例子,我们想测试我们知道均值和标准差。我们的数据是连续的,并且可以与正态分布建模。我们需要确定样本大小为N,这样我们可以区分的意思是100年和110年的意思。我们知道标准差是20。

当我们进行统计检验,我们一般测试零假设针对一个备择假设。我们找到一个T检验统计量,看它的分布在零假设下。如果我们观察一个不同寻常的价值,说有不到5%的机会发生如果零假设是正确的,那么我们拒绝零假设的选择。(5%的概率称为显著性水平测试的)。如果该值并不罕见,我们不拒绝零假设。

在这种情况下,样本均值T检验统计量。在虚假设条件下它的意思是100和标准差是20 /√(N)。首先让我们看一个固定样本量,N = 16。我们将拒绝零假设如果T在阴影区域,尾巴上的分布。使这一个单边测试,因为我们不会拒绝如果T是在较低的尾巴。截止这个阴影区域是1.6个标准差。

rng (0,“旋风”);mu0 = 100;sig = 20;N = 16;α= 0.05;参看= 1α;截止= norminv相依,mu0团体/√(N));x = [linspace(截止90年),linspace(截止127年)];y = normpdf (x, mu0团体/√(N));h1 =情节(x, y); xhi = [cutoff, x(x>=cutoff)]; yhi = [0, y(x>=cutoff)]; patch(xhi,yhi,“b”);标题(样本均值的分布,N = 16);包含(样本均值的);ylabel (“密度”);文本(96 .01 sprintf (“拒绝如果意味着> %。4 g \ nProb = 0.05 ',截止),“颜色”,“b”);

这就是T表现在零假设下,但是在另一个呢?替代分布的意思是110年由红色曲线表示。

mu1 = 110;y2 = normpdf (x, mu1团体/√(N));h2 =线(x, y2,“颜色”,“r”);yhi = [0, y2 (x > =截止)];补丁(xhi yhi,“r”,“FaceAlpha”,0.25);P = 1 - normcdf截止,mu1团体/√(N));文本(115 .06点sprintf (“拒绝如果T > %。4 g \ nProb = % .2g ',截止,P),“颜色”,(1 0 0));传奇((h1 h2),“零假设”,备择假设的);

有更大的机会拒绝零假设,如果选择是正确的。这正是我们想要的。很容易想象如果我们看看累积分布函数(cdf)而不是密度(pdf)。直接从这张图我们可以阅读概率,而不是计算领域。

ynull = normcdf (x, mu0团体/√(N));yalt = normcdf (x, mu1团体/√(N));ynull h12 =情节(x,“b -”,x, yalt的r -);zval = norminv(设计);截止= mu0 + zval *团体/√(N);线((90年,截止截止),(参看参看0),“线型”,“:”);味精= sprintf ('截止= 100 + %。2 g \ \乘以20 / \ \清音{n}’,zval);文本(截止,酒精含量、味精、“颜色”,“b”);文本(min (x)、sprintf (“% % % g测试”100 *α),“颜色”,“b”,“verticalalignment”,“高级”)palt = normcdf(截止,mu1团体/√(N));线([90,截止],[palt palt],“颜色”,“r”,“线型”,“:”);文本(91年,palt + .02 sprintf (“权力是1 - %。2 g = % .2g '、palt 1-palt),“颜色”,(1 0 0));传奇(h12“零假设”,备择假设的);

这个图表显示了很大的概率统计(拒绝零假设)两种不同的μ值当N = 16。

幂函数拒绝零假设的概率定义为当另一种选择是正确的。这取决于选择的值和样本大小。我们将图的力量(也就是1 -提供的函数N,修复替代在110。我们将选择N达到80%的力量。图表显示,我们需要对N = 25。

DesiredPower = 0.80;Nvec = 1:30;截止= mu0 + norminv(参看)* sig, /√(Nvec);功率= 1 - normcdf(截止,mu1 sig, /√(Nvec));情节(Nvec、电力、“bo - - - - - -”,30 [0]、[DesiredPower DesiredPower),凯西:”);包含(“N =样本容量”)ylabel (“权力”)标题(的幂函数替代:\μ= 110”)

在这种过于简单的例子有一个公式来计算所需的值直接获得80%的力量:

mudiff = (mu1 - mu0) /团体;歌曲到手机上=装天花板(((norminv (1-DesiredPower) -norminv(参看))/ mudiff) ^ 2)
歌曲到手机上= 25

这是验证工作的,让我们做一个蒙特卡罗模拟和生成400个样本的大小25两个零假设下的意思是100,和在备择假设下的意思是110。如果我们测试每个样本,看看100年的意思是,我们应该期待约5%的第一组和第二组是重要的80%。

nsamples = 400;samplenum = 1: nsamples;N = 25;nsamples h0 = 0 (1);h1 = h0;j = 1: nsamples Z0 = normrnd (mu0,团体,N, 1);h0 (j) =中兴通讯(Z0 mu0,团体,α,“对”);Z1 = normrnd (mu1,团体,N, 1);h1 (j) =中兴通讯(Z1、mu0团体,α,“对”);结束p0 = cumsum (h0)。/ samplenum;p1 = cumsum (h1)。/ samplenum;情节(samplenum p0,“b -”samplenum p1,的r -)包含(的样本数量)ylabel (的比例显著)标题(功率计算的验证)传说(“零假设”,备择假设的,“位置”,“东”)

测试一个正常的意思是未知的标准差,两面

现在,让我们假设我们不知道标准差,我们想执行一个双面的测试,也就是说,一个拒绝零假设样本均值是否过高或过低。

检验统计量是t统计值,样本均值之间的差异和被测试的意思是,除以平均数标准误差。在零假设下,这个学生的t分布与n - 1自由度。在备择假设下,分布是一个非中心t分布与非中心参数等于规范化区别真正的意思,指的是被测试。

这两面测试我们分配了5%的机会一个错误在虚假设条件下同样两个反面,并拒绝如果检验统计量太极端。我们还必须考虑两个尾巴在任何选择。

N = 16;df = n - 1;α= 0.05;参看= 1α;cutoff1 = tinv(α/ 2,df);cutoff2 = tinv(1α/ 2,df);cutoff1 x = [linspace(5日),linspace (cutoff1 cutoff2) linspace (cutoff2 5)];y = tpdf (x, df);h1 =情节(x, y);xlo = [x (x < = cutoff1) cutoff1]; ylo = [y(x<=cutoff1),0]; xhi = [cutoff2,x(x>=cutoff2)]; yhi = [0, y(x>=cutoff2)]; patch(xlo,ylo,“b”);补丁(xhi yhi,“b”);标题(“t统计值的分布,N = 16”);包含(“t”);ylabel (“密度”);文本(2.5,0。,sprintf (“拒绝如果t > %。4 g \ nProb = 0.025 'cutoff2),“颜色”,“b”);文本(-4.5,0。,sprintf (如果t < %的拒绝。4 g \ nProb = 0.025 'cutoff1),“颜色”,“b”);

而不是研究幂函数只是在虚假设条件下,一个替代μ的值,我们可以看看它的函数μ。电力作为远离零假设μ值增加。我们可以使用sampsizepwr函数来计算的。功率计算我们需要指定一个值的标准差,我们怀疑将大约20。这是一幅幂函数的样本大小N = 16。

N = 16;x = linspace (90127);功率= sampsizepwr (“t”20 [100],x, [], N);情节(x,权力);包含(“真正的意思是“)ylabel (“权力”)标题(“幂函数N = 16”)

我们想要一个电源时的意思是110年的80%。根据这个图表,我们的力量小于50%的样本大小N = 16。样本大小会给我们想要的权力吗?

N = sampsizepwr (“t”20[100],110年,0.8)
N = 34

我们需要一个样本大小约为34。与上一个示例中,我们需要九个额外观测允许一个双边测试和弥补不知道真正的标准差。

我们可以一块各种N值的幂函数。

Nvec = 2;功率= sampsizepwr (“t”,110年20 [100],[],Nvec);情节(Nvec、电力、“bo - - - - - -”,40 [0],[DesiredPower DesiredPower),凯西:”);包含(“N =样本容量”)ylabel (“权力”)标题(的幂函数替代:\μ= 110”)

我们可以做一个模拟类似于早一点来验证我们得到我们所需要的力量。

nsamples = 400;samplenum = 1: nsamples;N = 34;nsamples h0 = 0 (1);h1 = h0;j = 1: nsamples Z0 = normrnd (mu0,团体,N, 1);h0 (j) = tt (Z0 mu0,α);Z1 = normrnd (mu1,团体,N, 1);h1 (j) = tt (Z1、mu0α);结束p0 = cumsum (h0)。/ samplenum;p1 = cumsum (h1)。/ samplenum;情节(samplenum p0,“b -”samplenum p1,的r -)包含(的样本数量)ylabel (的比例显著)标题(功率计算的验证)传说(“零假设”,备择假设的,“位置”,“东”)

假设我们可以承受50的样本大小。大概我们的力量检测替代值μ= 110将超过80%。如果我们保持在80%,替代我们可以检测吗?

mu1 = sampsizepwr (“t”20 [100],[]。8,50)
mu1 = 108.0837

测试一个比例

现在让我们将确定样本量的问题需要区分两个比例。假设我们抽样人口中约30%支持一些候选人,我们想样本足够多的人所以我们可以区分这个值从33%。

这里的想法是一样的。这里我们可以使用示例算作我们的检验统计量。这个数有二项分布。对于任何样本大小N我们可以计算截止拒绝零假设P = 0.30。例如N = 100,我们将拒绝零假设如果样本计数大于截止值计算如下:

N = 100;α= 0.05;p0 = 0.30;p1 = 0.33;截止= binoinv(1α,N, p0)
截止= 38

二项分布的复杂性,因为它是离散的。超过截止值的概率不是5%:

1 - binocdf(截止,N, p0)
ans = 0.0340

再一次,让我们计算能力对替代P = 0.33的样本大小。我们将使用一个片面(right-tailed)测试,因为我们只关注替代值大于30%。

Nvec = 50:50:2000;功率= sampsizepwr (“p”Nvec, p0, p1, [],“尾巴”,“对”);情节(Nvec、电力、“bo - - - - - -”2000年,[0],[DesiredPower DesiredPower),凯西:”);包含(“N =样本容量”)ylabel (“权力”)标题(的幂函数选择:p = 0.33”)

我们可以使用sampsizepwr函数来请求所需的样本量的80%。

approxN = sampsizepwr (“p”0.80 p0, p1, [],“尾巴”,“对”)
警告:值近似N > 200。策划能力的函数N可能揭示低N值所需的力量。approxN = 1500

一条警告消息告诉我们,答案是近似的。如果我们看看不同的样本大小的幂函数,我们可以看到,这个函数通常是增加,但不规则的,因为二项分布是离散的。让我们看看拒绝零假设的概率为p = 0.30, p = 0.33范围内的样本大小从1470年到1480年。

次要情节(1,1);Nvec = 1470:1480;功率= sampsizepwr (“p”Nvec, p0, p1, [],“尾巴”,“对”);情节(Nvec、电力、“ro - - - - - -”[min (Nvec), max (Nvec)], [DesiredPower DesiredPower),凯西:”);ylabel (sprintf (的概率(T >截止)\ nif p = 0.33 '甘氨胆酸)h_gca =;h_gca。XTickLabel =;ylim ([。78 .82]);次要情节(3、1、2);阿尔夫= sampsizepwr (“p”Nvec p0, p0, [],“尾巴”,“对”);情节(Nvec,阿尔夫,“bo - - - - - -”[min (Nvec), max (Nvec)],[αα],凯西:”);ylabel (sprintf (的概率(T >截止)\ nif p = 0.30 '甘氨胆酸)h_gca =;h_gca。XTickLabel =;ylim ([。04、06]);次要情节(3,1,3);截止= binoinv(1α,Nvec p0);情节(Nvec截止,“去,”);包含(“N =样本容量”)ylabel (“截止”)

这个情节揭示了幂函数曲线(情节)不仅是不规则的,但也能减少一些样本大小。这些是需要的样本量增加截断值(情节)为了保持显著性水平(中间情节)不大于5%。在这个范围内我们可以找到一个更小的样本容量提供所需电力的80%:

min (Nvec(功率> = 0.80))
ans = 1478

测试相关

例子中我们认为到目前为止,我们可以算出截止为实现一定的显著性水平检验统计量,并计算的概率超过截止下另一种假说。为我们的最后一个例子,让我们考虑这样一个问题,这并不是那么容易。

想象我们可以采取样本两个变量X和Y,我们想知道样本大小需要测试他们是否不相关的和替代他们的相关性高达0.4。虽然可以计算出样品的分布相关的转化t分布,我们用一个方法,我们甚至可以使用的问题,我们不能检验统计量的分布。

对于一个给定的样本,我们可以使用蒙特卡罗模拟来确定一个近似截断值试验的相关性。让我们做一个大的模拟运行,所以我们可以得到这个值准确。我们将从25日的样本大小。

nsamples = 10000;N = 25;α= 0.05;参看= 1α;r = 0 (1、nsamples);j = 1: nsamples xy = normrnd (0, 1, N, 2);r (j) = corr (xy (: 1), xy (:, 2));结束截止=分位数(r, conf)
截止= 0.3372

然后我们在备择假设下,可以生成样本和估计的力量测试。

nsamples = 1000;μ= [0;0);sig = [1 0.4;0.4 - 1];r = 0 (1、nsamples);j = 1: nsamples xy = mvnrnd(μ,团体,N);r (j) = corr (xy (: 1), xy (:, 2));结束(电力、powerci) = binofit(和(r >截止),nsamples)
功率= 0.6470 powerci = 0.6165 - 0.6767

我们估计65%的能力,我们有95%的信心,真正的价值是在62%和68%之间。得到一个80%的力量,我们需要一个更大的样本量。我们可能会增加50 N,估计样本容量的截断值,重复模拟。

nsamples = 10000;N = 50;α= 0.05;参看= 1α;r = 0 (1、nsamples);j = 1: nsamples xy = normrnd (0, 1, N, 2);r (j) = corr (xy (: 1), xy (:, 2));结束截止=分位数(r, conf) nsamples = 1000;μ= [0;0);sig = [1 0.4;0.4 - 1];r = 0 (1、nsamples);j = 1: nsamples xy = mvnrnd(μ,团体,N);r (j) = corr (xy (: 1), xy (:, 2));结束(电力、powerci) = binofit(和(r >截止),nsamples)
截止= 0.8990 powerci = 0.8786 - 0.9170 = 0.2315力量

这个样本给80%的力量比我们的目标。我们可以继续尝试这种方式,试图找到一个样本容量小于50能满足我们的要求。

结论

统计和机器学习的概率函数工具箱可以用来确定所需的样本量达到所需的水平的能力在一个假设检验。在一些问题可以直接计算样本大小;在别人需要搜索范围的样本大小,直到找到正确的价值。随机数生成器可以帮助验证所需的电力,也可以用来研究一个特定的力量替代条件下测试。