主要内容

이번역페이지는최신내용을담고있지않습니다。최신내용을영문으로보려면여기를클릭하십시오。

다변량정규분포

개요

다변량정규분포는일변량정규분포를둘이상의변수로일반화한것입니다。이는상관관계가있는변수로구성된확률벡터에대한분포이며,벡터의각요소는일변량정규분포를가집니다。가장간단한경우변수간에상관관계가없으며벡터의각요소는독립일변량정규확률변수입니다。

다변량정규분포는다루기쉽기때문에다변량데이터에대한모델로자주사용됩니다。

统计和机器学习工具箱™는다변량정규분포와관련있는몇가지기능을제공합니다。

  • mvnrnd를사용하여분포에서난수생성。

  • mvnpdf를사용하여특정값에서의확률밀도함수(pdf)계산。

  • mvncdf를사용하여특정값에서의누적분포함수(cdf)계산。

모수

다변량정규분포는다음표에있는모수를사용합니다。

모수 설명 일변량정규분포의상응하는값
μ 평균벡터 평균μ(스칼라)
Σ 공분산행렬(대각선요소는각변수에대한분산을포함하고,비대각선요소는변수간공분산을포함합니다。 분산σ2(스칼라)

1차원의경우,Σ는표준편차가아니라분산입니다。일변량정규분포의모수에대한자세한내용은모수항목을참조하십시오。

확률밀도함수

d차원다변량정규분포의확률밀도함수(pdf)는다음과같이지정됩니다。

y f x μ Σ 1 | Σ | (2 π d 经验值 1 2 x - μ Σ -1 x - μ )”

여기서x및μ는1×d벡터이고Σ는d×d양의정부호대칭행렬입니다。

참고로,统计和机器学习的工具箱는

  • 확률벡터생성에대해서만특이행렬Σ를지원합니다。Σ가특이행렬인경우에는pdf를동일한형식으로작성할수없습니다。

  • x와μ를열벡터가아닌행벡터로방향을지정하여사용합니다。

예제는이변량정규분포pdf항목을참조하십시오。

누적분포함수

x에서계산한다변량정규누적분포함수(cdf)는다변량정규분포를따르는확률벡터v가상한이x로정의된반무한사각형안에존재할확률로정의됩니다。

公关 v 1 x 1 v 2 x 2 ... v d x d

다변량정규cdf는닫힌형식을갖지않지만,mvncdf는 cdf값을 수치적으로 계산할 수 있습니다.

예제는이변량정규분포cdf항목을참조하십시오。

예제

이변량정규분포pdf

모수Mu = [0 0]σ = [0.25 0.3;0.3 - 1)을갖는이변량정규분포의pdf를계산하고플로팅합니다。

모수μσ를정의합니다。

Mu = [0 0];σ = [0.25 0.3;0.3 - 1];

2차원공간에서균일한간격을갖는점의그리드를만듭니다。

x1 = 3:0.2:3;x2 = 3:0.2:3;(X1, X2) = meshgrid (X1, X2);X = [x1 (:) x2 (:)];

그리드점에서정규분포의pdf를계산합니다。

y = mvnpdf (X,μ、σ);y =重塑(y,长度(x2)、长度(x1));

pdf값을플로팅합니다。

冲浪(x1, x2, y) caxis ([min (y (:)) -0.5 * (y(:)),马克斯(y(:))))轴([3 3 3 3 0 0.4])包含(x1的) ylabel (“x2”) zlabel (的概率密度

图中包含一个坐标轴。轴包含一个类型为曲面的对象。

이변량정규분포cdf

이변량정규분포의cdf를계산하고플로팅합니다。

평균벡터μ와공분산행렬σ를정의합니다。

Mu = [1 -1];σ=[。9。4;。4。3);

2차원공간에서균일한간격을갖는625개점의그리드를만듭니다。

(X1, X2) = meshgrid (linspace(1、3、25)”,linspace(3、1,25)');X = [x1 (:) x2 (:)];

그리드점에서정규분포의cdf를계산합니다。

p = mvncdf (X,μ、σ);

它强调값을플로팅합니다。

Z =重塑(p, 25日,25日);冲浪(X1, X2, Z)

图中包含一个坐标轴。轴包含一个类型为曲面的对象。

사각형영역에대한확률

이변량정규분포의단위정사각형에대한확률을계산하고그결과에대한등고선플롯을생성합니다。

이변량정규분포모수μσ를정의합니다。

Mu = [0 0];σ = [0.25 0.3;0.3 - 1];

단위정사각형에대한확률을계산합니다。

p = mvncdf([0 0],[1 1],mu,Sigma)
p = 0.2097

결과를시각화하기위해먼저2차원공간에서균일한간격을갖는점의그리드를만듭니다。

x1 = 3: .2:3;x2 = 3: .2:3;(X1, X2) = meshgrid (X1, X2);X = [x1 (:) x2 (:)];

그런다음그리드점에서정규분포의pdf를계산합니다。

y = mvnpdf (X,μ、σ);y =重塑(y,长度(x2)、长度(x1));

마지막으로,단위정사각형을포함하는다변량정규분포의등고선플롯을생성합니다。

等值线(x1,x2,y,[0.0001 0.001 0.01 0.05 0.15 0.25 0.35]) xlabel(“x”) ylabel (“y”)行([0 0 1 1 0],[1 0 0 1 1],“线型”“——”“颜色”“k”

图中包含一个坐标轴。轴包含等高线、直线两种对象。

다변량누적확률을계산하려면일변량확률을계산할때보다상당히더많은작업이필요합니다。기본적으로,mvncdf함수는최대기계정밀도보다작은정밀도로값을계산하고두번째선택적출력값으로오차에대한추정값을반환합니다。이경우의오차추정값을확인합니다。

[p,err] = mvncdf([0 0],[1 1],mu,Sigma)
p = 0.2097
呃= 1.0000 e-08

참고문헌

Kotz, S. N. Balakrishnan和N. L. Johnson。连续多元分布:第1卷:模型和应用。第2版。纽约:约翰·威利父子公司,2000。

참고항목

|||

관련항목