이번역페이지는최신내용을담고있지않습니다。최신내용을영문으로보려면여기를클릭하십시오。一个>
정규분포가(우스분포라고도함)는2 -모수곡선족입니다。모델링에정규분포를사용해야하는일반적인이유는중심극한정리때문입니다。이정리에서는대략적으로표본크기가무한대로이동함에따라유한한평균과분산을갖는모든분포에서추출된독립된표본의합이정규분포로수렴된다고규정합니다。
统计和机器学习工具箱™에서는다음과같이정규분포를사용하는여러방법을제공합니다。
확률분포를표본데이터에피팅하거나(<一个href="//www.tatmou.com/kr/kr/help/stats/fitdist.html">fitdist
)모수값을지정하여(<一个href="//www.tatmou.com/kr/kr/help/stats/makedist.html">makedist
)확률분포객체<一个href="//www.tatmou.com/kr/kr/help/stats/prob.normaldistribution.html">NormalDistribution
을생성합니다。그런다음객체함수를사용하여분포를실행하고,난수를생성하는등의작업을수행합니다。
분포피팅기一个>앱을사용하여대화형방식으로정규분포를사용합니다。앱에서객체를내보내고객체함수를사용할수있습니다。
지정된분포모수를이용해분포전용함수(<一个href="//www.tatmou.com/kr/kr/help/stats/normcdf.html">normcdf
,<一个href="//www.tatmou.com/kr/kr/help/stats/normpdf.html">normpdf
,<一个href="//www.tatmou.com/kr/kr/help/stats/norminv.html">norminv
,<一个href="//www.tatmou.com/kr/kr/help/stats/normlike.html" hreflang="en">normlike
,<一个href="//www.tatmou.com/kr/kr/help/stats/normstat.html" hreflang="en">normstat
,<一个href="//www.tatmou.com/kr/kr/help/stats/normfit.html" hreflang="en">normfit
,<一个href="//www.tatmou.com/kr/kr/help/stats/normrnd.html">normrnd
)를사용합니다。분포전용함수는여러정규분포의모수를받을수있습니다。
일반분포함수(<一个href="//www.tatmou.com/kr/kr/help/stats/prob.normaldistribution.cdf.html">提供
,<一个href="//www.tatmou.com/kr/kr/help/stats/prob.normaldistribution.icdf.html" hreflang="en">icdf
,<一个href="//www.tatmou.com/kr/kr/help/stats/prob.normaldistribution.pdf.html">pdf
,<一个href="//www.tatmou.com/kr/kr/help/stats/prob.normaldistribution.random.html">随机
)를지정된분포이름(“正常”
)및모수와함께사용합니다。
정규분포는다음과같은모수를사용합니다。
모수 | 설명 | 지원 |
---|---|---|
μ (<年代p一个nclass="inlineequation">μ年代p一个n>) |
평균 | |
σ (<年代p一个nclass="inlineequation">σ年代p一个n>) |
표준편차 |
표준정규분포는평균이0이고단위표준편차를가집니다。z가표준정규분포이면σz +µ도평균µ및표준편차σ를갖는정규분포입니다。반대로x가평균µ및표준편차σ를갖는정규분포이면z = (x -µ)/σ는표준정규분포입니다。
최대가능도추정값(企业)은가능도함수를최대화하는모수추정값입니다。정규분포에대한<年代p一个nclass="inlineequation">μ年代p一个n>와<年代p一个nclass="inlineequation">σ<年代up>2年代up>의최대가능도추정량은각각다음과같습니다。
및
는표본<年代p一个nclass="inlineequation">x<年代ub>1年代ub>, x<年代ub>2年代ub>x、…<年代ub>n年代ub>에대한표본평균입니다。표본평균은모수<年代p一个nclass="inlineequation">μ年代p一个n>의무편향추정량입니다。하지만<年代p一个nclass="inlineequation">年代<年代up>2年代up>大中型企业年代ub>는모수<年代p一个nclass="inlineequation">σ<年代up>2年代up>의편향추정량입니다。즉,기대값이모수와같지않습니다。
최소분산무편향추정량(MVUE)은정규분포의모수를추정하는데일반적으로사용됩니다。MVUE는모수의모든무편향추정량에대한최소분산을갖는추정량입니다。정규분포에대한모수<年代p一个nclass="inlineequation">μ年代p一个n>와<年代p一个nclass="inlineequation">σ<年代up>2年代up>의MVUE는각각표본평균<年代p一个nclass="inlineequation">x̄年代p一个n>와표본분산<年代p一个nclass="inlineequation">年代<年代up>2年代up>입니다。
정규분포를데이터에피팅하고모수추정값을구하려면<一个href="//www.tatmou.com/kr/kr/help/stats/normfit.html" hreflang="en">normfit
,<一个href="//www.tatmou.com/kr/kr/help/stats/fitdist.html">fitdist
또는<一个href="//www.tatmou.com/kr/kr/help/stats/mle.html">大中型企业
를사용하십시오。
중도절단되지않은데이터에대해normfit
및fitdist
는무편향추정값을구하고,大中型企业
는최대가능도추정값을구합니다。
중도절단된데이터에대해normfit
,fitdist
,大中型企业
는최대가능도추정값을구합니다。
모수추정값을반환하는normfit
및大中型企业
와달리,fitdist
는피팅된확률분포객체<一个href="//www.tatmou.com/kr/kr/help/stats/prob.normaldistribution.html">NormalDistribution
을반환합니다。객체속성μ
와σ
는모수추정값을저장합니다。
예제는<一个href="//www.tatmou.com/kr/kr/help/stats/normal-distribution.html" class="intrnllnk">정규분포객체피팅하기一个>항목을참조하십시오。
정규확률밀도함수(pdf)는다음과같습니다。
가능도함수는모수의함수로표시되는pdf입니다。최대가능도추정값은(标定)x
의고정값에대해가능도함수를최대화하는모수추정값입니다。
예제는<一个href="//www.tatmou.com/kr/kr/help/stats/normal-distribution.html" class="intrnllnk">정규분포pdf를계산하고플로팅하기一个>항목을참조하십시오。
정규누적분포함수(cdf)는다음과같습니다。
p年代p一个n>는모수<年代p一个nclass="inlineequation">μ年代p一个n>및<年代p一个nclass="inlineequation">σ年代p一个n>를갖는정규분포에서하나의관측값이구간<年代p一个nclass="inlineequation">(-∞,x]年代p一个n>에속할확률입니다。
표준정규누적분포함수<年代p一个nclass="inlineequation">Φ(x)年代p一个n>는기능적으로오차함수<一个href="//www.tatmou.com/kr/kr/help/matlab/ref/erf.html">小块土地
와관련됩니다。
여기서는다음을조건으로합니다。
예제는<一个href="//www.tatmou.com/kr/kr/help/stats/normal-distribution.html" class="intrnllnk">표준정규분포cdf플로팅하기一个>항목을참조하십시오。
표본데이터를불러오고학생들의시험성적데이터의첫번째열을포함하는벡터를만듭니다。
负载<年代p一个n年代tyle="color:#A020F0">examgrades年代p一个n>x =成绩(:1);
이를데이터에피팅하여정규분포객체를생성합니다。
pd = fitdist (x,<年代p一个n年代tyle="color:#A020F0">“正常”年代p一个n>)
正态分布mu = 75.0083 [73.4321, 76.5846] sigma = 8.7202 [7.7391, 9.98843]
모수추정값다음에있는구간은분포모수에대한95%신뢰구간입니다。
모수<年代p一个nclass="inlineequation"> 0가이고<年代p一个nclass="inlineequation"> 1인가표준정규분포에대한pdf를계산합니다。
x = [3: .1:3];y = normpdf (x 0 1);
pdf를플로팅합니다。
情节(x, y)
표준정규분포객체를생성합니다。
pd = makedist (<年代p一个n年代tyle="color:#A020F0">“正常”年代p一个n>)
pd =正态分布正态分布mu = 0 sigma = 1
x
값을지정하고cdf를계산합니다。
x = 3: .1:3;p = cdf (pd, x);
표준정규분포의cdf를플로팅합니다。
情节(x, p)
감마분포는형태모수<年代p一个nclass="inlineequation"> 와스케일모수<年代p一个nclass="inlineequation"> 를갖습니다。<年代p一个nclass="inlineequation"> 의크기가큰경우,감마분포는평균이<年代p一个nclass="inlineequation"> 이고분산이<年代p一个nclass="inlineequation"> 인정규분포에가깝습니다。
모수一个= 100
및b = 5
를갖는감마분포의pdf를계산합니다。
一个= 100;b = 5;x = 250:750;y_gam = gampdf (x, a, b);
비교를위해,감마가근사하는정규분포의평균,표준편차및pdf를계산합니다。
μa * b =
μ= 500
σ=√6 (a * b ^ 2)
σ= 50
y_norm = normpdf (x,μ、σ);
감마분포와정규분포의pdf를동일한图에플로팅합니다。
情节(x, y_gam,<年代p一个n年代tyle="color:#A020F0">“- - -”年代p一个n>, x, y_norm<年代p一个n年代tyle="color:#A020F0">“-”。年代p一个n>)标题(<年代p一个n年代tyle="color:#A020F0">'Gamma and Normal pdf '年代p一个n>)包含(<年代p一个n年代tyle="color:#A020F0">“观察”年代p一个n>) ylabel (<年代p一个n年代tyle="color:#A020F0">的概率密度年代p一个n>)传说(<年代p一个n年代tyle="color:#A020F0">伽马分布的年代p一个n>,<年代p一个n年代tyle="color:#A020F0">“正态分布”年代p一个n>)
정규분포의pdf는감마분포pdf를의근사합니다。
X가모수<年代p一个nclass="emphasis">µ및<年代p一个nclass="emphasis">σ를갖는로그정규분포를따르면日志(<年代p一个nclass="emphasis">X)는평균<年代p一个nclass="emphasis">µ및표준편차<年代p一个nclass="emphasis">σ를갖는정규분포를따릅니다。분포객체를사용하여정규분포와로그정규분포사이의관계를조사합니다。
모수값을지정하여로그정규분포객체를만듭니다。
pd = makedist (<年代p一个n年代tyle="color:#A020F0">对数正态的年代p一个n>,<年代p一个n年代tyle="color:#A020F0">“亩”年代p一个n>5,<年代p一个n年代tyle="color:#A020F0">“σ”年代p一个n>, 2)
pd = LognormalDistribution log正态分布mu = 5 sigma = 2
로그정규분포의평균을계산합니다。
意思是(pd)
ans = 1.0966 e + 03
로그정규분포의평균은μ
모수와동일하지않습니다。로그값의평균은μ
와동일합니다。난수를생성하여이관계를확인합니다。
로그정규분포에서난수를생성하고그로그값을계산합니다。
rng (<年代p一个n年代tyle="color:#A020F0">“默认”年代p一个n>);<年代p一个n年代tyle="color:#228B22">%的再现性年代p一个n>x =随机(pd, 10000, (1);计算lnx =日志(x);
로그값의평균을계산합니다。
m =意味着(计算lnx)
m = 5.0033
x
가로그정규분포를갖기때문에x
의로그의평균은x
의μ
모수에가깝습니다。
정규분포가피팅된计算lnx
의히스토그램을생성합니다。
histfit(计算lnx)
이플롯을통해x
의로그값이정규분포된것을알수있습니다。
histfit
은fitdist
를사용하여분포를데이터에피팅합니다。피팅에사용되는모수를가져오려면fitdist
를사용하십시오。
pd_normal = fitdist(计算lnx,<年代p一个n年代tyle="color:#A020F0">“正常”年代p一个n>)
pd_normal = NormalDistribution正态分布mu = 5.00332 [4.96445, 5.04219] sigma = 1.98296 [1.95585, 2.01083]
추정된정규분포모수는로그정규분포모수5와2에가깝습니다。
t
분포pdf와정규분포pdf비교하기스튜던트<年代p一个nclass="emphasis">t분포는단일모수<年代p一个nclass="emphasis">ν(자유도)에종속적인곡선족입니다。자유도<年代p一个nclass="emphasis">ν가무한대에가까워지면<年代p一个nclass="emphasis">t분포는표준정규분포에가까워집니다。
모수ν= 5
를갖는스튜던트<年代p一个nclass="emphasis">t분포pdf와의모수ν= 15
를갖는스튜던트<年代p一个nclass="emphasis">t분포의pdf를계산합니다。
x = [5:0.1:5];日元= tpdf (x, 5);y2 = tpdf (x, 15);
표준정규분포의pdf를계산합니다。
z = normpdf (x 0 1);
스튜던트<年代p一个nclass="emphasis">tpdf와표준정규pdf를동일한图에플로팅합니다。
情节(x, y₁,<年代p一个n年代tyle="color:#A020F0">“-”。年代p一个n>, x, y2,<年代p一个n年代tyle="color:#A020F0">“——”年代p一个n>, x, z,<年代p一个n年代tyle="color:#A020F0">“- - -”年代p一个n>)传说(<年代p一个n年代tyle="color:#A020F0">'Student' st Distribution with \nu=5'年代p一个n>,<年代p一个n年代tyle="color:#0000FF">...年代p一个n>'Student' st Distribution with \nu=15'年代p一个n>,<年代p一个n年代tyle="color:#0000FF">...年代p一个n>标准正态分布的年代p一个n>,<年代p一个n年代tyle="color:#A020F0">“位置”年代p一个n>,<年代p一个n年代tyle="color:#A020F0">“最佳”年代p一个n>)包含(<年代p一个n年代tyle="color:#A020F0">“观察”年代p一个n>) ylabel (<年代p一个n年代tyle="color:#A020F0">的概率密度年代p一个n>)标题(<年代p一个n年代tyle="color:#A020F0">'Student' s tand Standard Normal pdf '年代p一个n>)
표준정규pdf의꼬리가스튜던트<年代p一个nclass="emphasis">tpdf의꼬리보다짧습니다。
Birnbaum-Saunders分布一个>- - - - - -<年代p一个nclass="emphasis">x가모수β및γ를갖는번바움——손더스분포를가지면
위의분포는표준정규분포를갖습니다。
卡方分布一个>——카이제곱분포는독립표준정규확률변수의제곱합의분포입니다。<年代p一个nclass="emphasis">n개의관측값세트가분산σ<年代up>2年代up>으로정규분포되어있고<年代p一个nclass="emphasis">年代2年代up>이표본분산이라면<年代p一个nclass="inlineequation">(n - 1)<年代up>2年代up>/σ<年代up>2年代up>은자유도가<年代p一个nclass="inlineequation">n - 1年代p一个n>인카이제곱분포를갖습니다。<一个href="//www.tatmou.com/kr/kr/help/stats/normfit.html" hreflang="en">normfit
함수는이관계를사용하여정규모수σ<年代up>2年代up>의추정값에대한신뢰구간을계산합니다。
极端值分布一个>——극값분포는정규분포와같이꼬리가기하급수적으로빠르게감소하는분포의가장작은값이나가장큰값을모델링하는데적합합니다。
物流配送一个>- - - - - -로지스틱분포는성장모델에대해그리고로지스틱회귀에서사용됩니다。로지스틱분포는정규분포보다꼬리가길고첨도가높습니다。
x가평균이μ인정규분포에서추출한크기n의임의표본이라면다음과같은통계량은자유도가<年代p一个nclass="inlineequation">n - 1年代p一个n>인스튜던트t분포를갖습니다。
여기서<年代p一个nclass="inlineequation"> 는표본평균이고年代는표본표준편차입니다。
阿布拉莫维茨和斯特根。数学函数手册。纽约:多佛,1964年。
M.埃文斯,N.黑斯廷斯和B.皮科克。《统计分布》,第2版,霍博肯,新泽西州:约翰·威利父子公司,1993。
终身数据的统计模型和方法。新泽西州霍博肯:Wiley-Interscience出版社,1982年。
Marsaglia G.和w.w. Tsang。从减少或对称单峰密度函数中取样的快速、容易实现的方法。科学与统计计算杂志。1984年第5卷第2期,349-359页。
[5]米克尔,小Q,洛杉矶埃斯科瓦尔。可靠性数据的统计方法。《中华人民共和国证券法》,1998。
小块土地
|<年代p一个n我temscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">NormalDistribution
|<年代p一个n我temscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">normcdf
|<年代p一个n我temscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">normfit
|<年代p一个n我temscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">norminv
|<年代p一个n我temscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">normlike
|<年代p一个n我temscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">normpdf
|<年代p一个n我temscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">normrnd
|<年代p一个n我temscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">normstat