主要内容

이번역페이지는최신내용을담고있지않습니다。최신내용을영문으로보려면여기를클릭하십시오。

gmdistribution

가우스혼합모델생성

설명

gmdistribution객체는다변량가우스분포성분으로구성된다변량분포인가우스혼합분포가(우스혼합모델또는GMM이라고도함)를저장합니다。각성분은자체의평균과공분산으로정의됩니다。혼합은혼합비율로구성된벡터로정의됩니다。여기서각혼합비율은해당성분을설명하는모집단비율입니다。

생성

다음두가지방법으로gmdistribution모델객체를생성할수있습니다。

  • 여기서다루는gmdistribution함수를사용하여분포모수를지정하여gmdistribution모델객체를생성합니다。

  • fitgmdist함수를사용해,고정된개수의성분이주어진경우에gmdistribution모델객체를데이터에피팅합니다。

설명

예제

通用汽车= gmdistribution (μσ는지정된평균μ및공분산σ를동일한혼합비율로사용하여gmdistribution모델객체를생성합니다。

通用汽车= gmdistribution (μσp는다변량가우스분포성분의혼합비율을지정합니다。

입력인수

모두확장

다변량가우스분포성분의평균으로,k×m크기의숫자형행렬로지정됩니다。여기k서는성분의개수이고m은각성분에포함된변수의개수입니다。μ(我,:)는성분의평균입니다。

데이터형:|

다변량가우스분포성분의공분산으로,숫자형벡터,행렬또는배열로지정됩니다。

k가성분의개수이고m이각성분에포함된변수의개수라고가정할경우σ는다음표에나와있는값중하나입니다。

설명
m×m×k배열 σ(:,:,我)는성분의공분산행렬입니다。
1×m×k배열 공분산행렬이대각행렬이됩니다。σ(1:我)는성분의공분산행렬의대각요소를포함합니다。
m×m행렬 모든성분에대한공분산행렬이같습니다。
1×m벡터 모든성분에대해공분산행렬이같으며,공분산행렬은대각행렬입니다。

데이터형:|

혼합성분의혼합비율로,길이가k인숫자형벡터로지정됩니다。여기k서는성분의개수입니다。디폴트값은1 / k로구성된행벡터인데이는모든성분에대해동일한혼합비율을설정합니다。p의총합이1이되지않는경우,gmdistribution이합을정규화합니다。

데이터형:|

속성

모두확장

분포모수

이속성은읽기전용입니다。

다변량가우스분포성분의평균으로,k×m크기의숫자형행렬로지정됩니다。여기k서는성분의개수이고m은각성분에포함된변수의개수입니다。μ(我,:)는성분의평균입니다。

  • gmdistribution함수를사용하여gmdistribution객체를생성하면gmdistributionμ입력인수가이속성을설정합니다。

  • fitgmdist함수를사용하여gmdistribution객체를데이터에피팅하면fitgmdist가이속성의값을설정합니다。

데이터형:|

이속성은읽기전용입니다。

다변량가우스분포성분의공분산으로,숫자형벡터,행렬또는배열로지정됩니다。

k가성분의개수이고m이각성분에포함된변수의개수라고가정할경우σ는다음표에나와있는값중하나입니다。

설명
m×m×k배열 σ(:,:,我)는성분의공분산행렬입니다。
1×m×k배열 공분산행렬이대각행렬이됩니다。σ(1:我)는성분의공분산행렬의대각요소를포함합니다。
m×m행렬 모든성분에대한공분산행렬이같습니다。
1×m벡터 모든성분에대해공분산행렬이같으며,공분산행렬은대각행렬입니다。

  • gmdistribution함수를사용하여gmdistribution객체를생성하면gmdistributionσ입력인수가이속성을설정합니다。

  • fitgmdist함수를사용하여gmdistribution객체를데이터에피팅하면fitgmdist가이속성의값을설정합니다。

데이터형:|

이속성은읽기전용입니다。

혼합성분의혼합비율로,1×k숫자형벡터로지정됩니다。

  • gmdistribution함수를사용하여gmdistribution객체를생성하면gmdistributionp입력인수가이속성을설정합니다。

  • fitgmdist함수를사용하여gmdistribution객체를데이터에피팅하면fitgmdist가이속성의값을설정합니다。

데이터형:|

분포특징

이속성은읽기전용입니다。

공분산행렬유형으로,“对角线”또는“全部”로지정됩니다。

  • gmdistribution함수를사용하여gmdistribution객체를생성하면gmdistributionσ입력인수에포함된공분산행렬의유형에따라이속성이설정됩니다。

  • fitgmdist함수를사용하여gmdistribution객체를데이터에피팅하면fitgmdist“CovarianceType”이름——값쌍의인수에따라이속성이설정됩니다。

이속성은읽기전용입니다。

분포이름으로,高斯混合分布的으로지정됩니다。

이속성은읽기전용입니다。

혼합성분의개수(k)로,양의정수로지정됩니다。

  • gmdistribution함수를사용하여gmdistribution객체를생성하면gmdistribution의입력인수μσp가이속성을설정합니다。

  • fitgmdist함수를사용하여gmdistribution객체를데이터에피팅하면fitgmdistk입력인수가이속성을설정합니다。

데이터형:|

이속성은읽기전용입니다。

다변량가우스분포성분에포함된변수의개수m으로,양의정수로지정됩니다。

  • gmdistribution함수를사용하여gmdistribution객체를생성하면gmdistribution의입력인수μσp가이속성을설정합니다。

  • fitgmdist함수를사용하여gmdistribution객체를데이터에피팅하면fitgmdistX입력데이터가이속성을설정합니다。

데이터형:

이속성은읽기전용입니다。

공분산행렬이혼합성분간에공유되는지여부를나타내는플래그로,真正的또는로지정됩니다。

  • gmdistribution함수를사용하여gmdistribution객체를생성하면gmdistributionσ입력인수에포함된공분산행렬의유형에따라이속성이설정됩니다。

  • fitgmdist함수를사용하여gmdistribution객체를데이터에피팅하면fitgmdist“SharedCovariance”이름——값쌍의인수에따라이속성이설정됩니다。

데이터형:逻辑

피팅된객체에대한속성

다음속성은fitgmdist를사용하여생성하는피팅된객체에만적용됩니다。이속성의값은gmdistribution함수를사용하여gmdistribution객체를생성하는경우비어있습니다。

이속성은읽기전용입니다。

아카이케정보기준(AIC)으로,스칼라로지정됩니다。AIC = 2*NlogL + 2*p이며여기서NlogL은음의로그가능도(NegativeLogLikelihood속성)이고p는추정된모수의개수입니다。

AIC는동일한데이터에대한여러모델피팅을비교하는데사용할수있는모델선택도구입니다。AIC는복잡도,특히모수개수에대한벌점을포함하는모델피팅에대한가능도기반측정값입니다。여러모델을비교할때는AIC의값이더작은모델이더좋습니다。

이속성은gmdistribution함수를사용하여gmdistribution객체를생성하는경우비어있습니다。

데이터형:|

이속성은읽기전용입니다。

베이즈정보기준(BIC)으로,스칼라로지정됩니다。BIC = 2*NlogL + p*log(n)이며여기서NlogL은음의로그가능도(NegativeLogLikelihood속성)이고,n은관측값의개수이며,p는추정된모수의개수입니다。

BIC는동일한데이터에대한여러모델피팅을비교하는데사용할수있는모델선택도구입니다。BIC는복잡도,특히모수개수에대한벌점을포함하는모델피팅에대한가능도기반측정값입니다。여러모델을비교할때는BIC값이가장낮은모델이가장적합한피팅모델입니다。

이속성은gmdistribution함수를사용하여gmdistribution객체를생성하는경우비어있습니다。

데이터형:|

이속성은읽기전용입니다。

가우스혼합모델을피팅할때기대값최대화(EM)알고리즘이수렴되는지여부를나타내는플래그로,真正的또는로지정됩니다。

fitgmdist“选项”이름——값쌍의인수를사용하여최적화옵션을변경할수있습니다。

이속성은gmdistribution함수를사용하여gmdistribution객체를생성하는경우비어있습니다。

데이터형:逻辑

이속성은읽기전용입니다。

fitgmdist의입력데이터X가주어진경우의피팅된가우스혼합모델의음의로그가능도로,스칼라로지정됩니다。

이속성은gmdistribution함수를사용하여gmdistribution객체를생성하는경우비어있습니다。

데이터형:|

이속성은읽기전용입니다。

기대값최대화(EM)알고리즘의반복횟수로,양의정수로지정됩니다。

fitgmdist“选项”이름——값쌍의인수를사용하여허용되는최대반복횟수등의최적화옵션을변경할수있습니다。

이속성은gmdistribution함수를사용하여gmdistribution객체를생성하는경우비어있습니다。

데이터형:

이속성은읽기전용입니다。

사후확률에대한허용오차로,[0,1 e-6]범위의음이아닌스칼라값이지정됩니다。

fitgmdist“ProbabilityTolerance”이름——값쌍의인수가이속성을설정합니다。

이속성은gmdistribution함수를사용하여gmdistribution객체를생성하는경우비어있습니다。

데이터형:|

이속성은읽기전용입니다。

정규화모수값으로,음이아닌스칼라로지정됩니다。

fitgmdist“RegularizationValue”이름——값쌍의인수가이속성을설정합니다。

이속성은gmdistribution함수를사용하여gmdistribution객체를생성하는경우비어있습니다。

데이터형:|

객체함수

提供 高斯混合分布的累积分布函数
集群 从高斯混合分布构造簇
泰姬陵 马氏距离到高斯混合分量
pdf 高斯混合分布的概率密度函数
高斯混合成分的后验概率
随机 随机变量来自高斯混合分布

예제

모두축소

gmdistribution함수를사용하여두개의성분을갖는이변량가우스혼합분포를생성합니다。

두개의이변량가우스혼합성분으로구성된분포모수(평균및공분산)를정의합니다。

Mu = [1 2;-3 -5];Sigma = cat(3,[2.5],[1 1])% 1-by-2-by-2数组
σ=σ(:,:1)= 2.0000 - 0.5000σ(:,:2)= 1 1

함수는세번째배열차원을따라공분산을결합합니다。정의된공분산행렬은대각행렬입니다。σ(1:我)는성분의공분산행렬의대각요소를포함합니다。

gmdistribution객체를생성합니다。기본적으로,gmdistribution함수는성분의비율이동일하도록혼합합니다。

通用= gmdistribution(μ、σ)
组分1:混合比例:0.500000均值:1 2组分2:混合比例:0.500000均值:-3 -5

通用汽车객체의속성을나열합니다。

属性(通用)
属性类gmdistribution: NumVariables DistributionName NumComponents ComponentProportion SharedCovariance NumIterations RegularizationValue NegativeLogLikelihood CovarianceType mu Sigma AIC BIC收敛概率公差

점표기법을사용하여이러한속성에액세스할수있습니다。예를들어,혼합성분의혼합비율을나타내는ComponentProportion속성에액세스해보겠습니다。

gm.ComponentProportion
ans =1×20.5000 - 0.5000

gmdistribution객체에는피팅된객체에만적용되는속성이있습니다。피팅된객체속성은另类投资会议BIC聚合NegativeLogLikelihoodNumIterationsProbabilityToleranceRegularizationValue입니다。gmdistribution함수를사용하고분포모수를지정하여객체를생성하는경우피팅된객체속성의값은비어있습니다。예를들어,점표기법을사용하여NegativeLogLikelihood속성에액세스해보십시오。

gm.NegativeLogLikelihood
ans = []

gmdistribution객체를생성한후에는객체함수를사용할수있습니다。누적분포함수(cdf)및확률밀도함수(pdf)의값을계산하려면提供pdf를사용하십시오。확률벡터를생성하려면随机을사용하십시오。군집분석을수행하려면集群泰姬陵를사용하십시오。

pdffsurf를사용하여객체를시각화합니다。

gmPDF = @ (x, y) arrayfun (@ (x0, y0) pdf(通用、(x0 y0)), x, y);fsurf (gmPDF 10 [-10])

图中包含一个坐标轴。坐标轴包含一个函数曲面类型的对象。

mvnrnd함수를사용하여두개의혼합된이변량가우스분포를따르는확률변량을생성합니다。fitgmdist함수를사용하여가우스혼합모델(GMM)을생성된데이터에피팅합니다。

두개의이변량가우스혼합성분으로구성된분포모수(평균및공분산)를정의합니다。

Mu1 = [1 2];第1分量的平均值Sigma1 = [20 0;0。5);第一个分量的协方差Mu2 = [-3 -5];第二分量的平均值Sigma2 = [1 0;0 1];第二分量的协方差

각성분에서같은개수의확률변량을생성하여이두확률변량집합을결합합니다。

rng (“默认”%的再现性r1 = mvnrnd (mu1 sigma1 1000);r2 = mvnrnd (mu2 sigma2 1000);X = [r1;r2);

결합된데이터세트X에는두개의혼합된이변량가우스분포를따르는확률변량이있습니다。

두개의성분을갖는GMM을X에피팅합니다。

通用= fitgmdist (X, 2)
组分1:混合比例:0.500000均值:-2.9617 -4.9727组分2:混合比例:0.500000均值:0.9539 2.0261

通用汽车객체의속성을나열합니다。

属性(通用)
属性类gmdistribution: NumVariables DistributionName NumComponents ComponentProportion SharedCovariance NumIterations RegularizationValue NegativeLogLikelihood CovarianceType mu Sigma AIC BIC收敛概率公差

점표기법을사용하여이러한속성에액세스할수있습니다。예를들어,피팅된모델이주어진경우데이터X에대한음의로그가능도를나타내는NegativeLogLikelihood속성에액세스해보겠습니다。

gm.NegativeLogLikelihood
ans = 7.0584 e + 03

gmdistribution객체를생성한후에는객체함수를사용할수있습니다。누적분포함수(cdf)및확률밀도함수(pdf)의값을계산하려면提供pdf를사용하십시오。확률변량을생성하려면随机을사용하십시오。군집분석을수행하려면集群泰姬陵를사용하십시오。

散射를사용하여X를플로팅합니다。pdffcontour를사용하여피팅된모델通用汽车을시각화합니다。

散射(X (: 1) X(:, 2), 10日“。”%大小为10的散点图持有gmPDF = @ (x, y) arrayfun (@ (x0, y0) pdf(通用、(x0 y0)), x, y);fcontour (gmPDF 6 [8])

图中包含一个坐标轴。坐标轴包含离散型、功能轮廓型2个对象。

참고문헌

G. McLachlan和D. Peel。有限混合模型。《中国科学院大学学报(自然科学版)》,2000。

R2007b에개발됨