主要内容

GMDistribution.

创建高斯混合模型

描述

一种GMDistribution.对象存储一个高斯混合分布,也称为高斯混合模型(GMM),它是一个由多元高斯分布组成的多元分布。每个分量由其均值和协方差定义。混合由混合比例向量定义,其中每个混合比例表示由相应组件描述的总体比例。

创建

您可以创建GMDistribution.用两种方法建模对象。

  • 使用GMDistribution.函数(这里描述)创建一个GMDistribution.通过指定分发参数来模型对象。

  • 使用fitgmdist适合一个功能GMDistribution.给定固定数量的组件,将对象建模为数据。

描述

例子

GM.= gmdistribution (Sigma.创建一个GMDistribution.使用指定的方法建模对象和协方差Sigma.平等混合比例。

GM.= gmdistribution (Sigma.P.指定多变量高斯分布组分的混合比例。

输入参数

全部展开

多元高斯分布分量的均值,指定为K.-经过-m数字矩阵,K.是组件数量和m是每个组件中的变量数。μ(我,:)是组件的平均值一世

数据类型:|

多变量高斯分发组件的协方差,指定为数字矢量,矩阵或数组。

考虑到K.是组件数量和m是每个组件中的变量数,Sigma.是此表中的值之一。

价值 描述
m-经过-m-经过-K.大批 西格玛(:,:我)分量的协方差矩阵是多少一世
1 -m-经过-K.大批 协方差矩阵是对角的。σ(1:我)包含组件的协方差矩阵的对角线元素一世
m-经过-m矩阵 协方差矩阵在组件上是相同的。
1 -m向量 协方差矩阵是对角线和跨组件的相同。

数据类型:|

混合成分的混合成分的比例,指定为长度的数字矢量K.,在那里K.为组件的数量。默认值是行向量(1/)K.)S,其设定平等的比例。如果P.不一致1GMDistribution.标准化它。

数据类型:|

属性

全部展开

分布参数

此属性是只读的。

多元高斯分布分量的均值,指定为K.-经过-m数字矩阵,K.是组件数量和m是每个组件中的变量数。μ(我,:)是组件的平均值一世

  • 如果你创造一个GMDistribution.通过使用的对象GMDistribution.功能,然后是输入论点GMDistribution.设置此属性。

  • 如果你适合一个GMDistribution.使用使用的对象fitgmdist然后fitgmdist估计这个财产。

数据类型:|

此属性是只读的。

多变量高斯分发组件的协方差,指定为数字矢量,矩阵或数组。

考虑到K.是组件数量和m是每个组件中的变量数,σ是此表中的值之一。

价值 描述
m-经过-m-经过-K.大批 σ(:,:,我)分量的协方差矩阵是多少一世
1 -m-经过-K.大批 协方差矩阵是对角的。西格玛(1,:,i)包含组件的协方差矩阵的对角线元素一世
m-经过-m矩阵 协方差矩阵在组件上是相同的。
1 -m向量 协方差矩阵是对角线和跨组件的相同。

  • 如果你创造一个GMDistribution.通过使用的对象GMDistribution.功能,然后是Sigma.输入论点GMDistribution.设置此属性。

  • 如果你适合一个GMDistribution.使用使用的对象fitgmdist然后fitgmdist估计这个财产。

数据类型:|

此属性是只读的。

混合成分的混合比例,指定为1 ×K.数字矢量。

  • 如果你创造一个GMDistribution.通过使用的对象GMDistribution.功能,然后是P.输入论点GMDistribution.设置此属性。

  • 如果你适合一个GMDistribution.使用使用的对象fitgmdist然后fitgmdist估计这个财产。

数据类型:|

分布特征

此属性是只读的。

指定的协方差矩阵类型'对角线''满的'

  • 如果你创造一个GMDistribution.通过使用的对象GMDistribution.函数,然后是协方差矩阵的类型Sigma.输入论点GMDistribution.设置此属性。

  • 如果你适合一个GMDistribution.使用使用的对象fitgmdist功能,然后是“CovarianceType”名称 - 值对参数fitgmdist设置此属性。

此属性是只读的。

分布名称,指定为'高斯混合分布'

此属性是只读的。

混合组件数量,K.,指定为正整数。

  • 如果你创造一个GMDistribution.通过使用的对象GMDistribution.函数,然后输入参数Sigma., 和P.GMDistribution.设置此属性。

  • 如果你适合一个GMDistribution.使用使用的对象fitgmdist功能,然后是K.输入论点fitgmdist设置此属性。

数据类型:|

此属性是只读的。

多变量高斯分布组件中的变量数,m,指定为正整数。

  • 如果你创造一个GMDistribution.通过使用的对象GMDistribution.函数,然后输入参数Sigma., 和P.GMDistribution.设置此属性。

  • 如果你适合一个GMDistribution.使用使用的对象fitgmdist功能,然后输入数据Xfitgmdist设置此属性。

数据类型:

此属性是只读的。

指示是否在混合组件中共享协方差矩阵的标志,指定为真正的错误的

  • 如果你创造一个GMDistribution.通过使用的对象GMDistribution.函数,然后是协方差矩阵的类型Sigma.输入论点GMDistribution.设置此属性。

  • 如果你适合一个GMDistribution.使用使用的对象fitgmdist功能,然后是“SharedCovariance”名称 - 值对参数fitgmdist设置此属性。

数据类型:逻辑

适合物体的性质

以下属性仅适用于使用您创建的拟合对象fitgmdist.如果您创建一个GMDistribution.通过使用的对象GMDistribution.函数。

此属性是只读的。

Akaike信息标准(AIC),指定为标量。AIC = 2 * NLOGL + 2 * P.,在那里NlogL负对数似然(theNegativeLogLikelihood财产)和P.为估计参数的个数。

AIC是您可以使用的模型选择工具来比较多个型号适合相同的数据。AIC是一种基于可能的模型拟合度量,包括复杂性的惩罚,具体地,参数的数量。当您比较多个模型时,一个具有较小AIC值的模型更好。

如果您创建一个,则此属性是空的GMDistribution.通过使用的对象GMDistribution.函数。

数据类型:|

此属性是只读的。

贝叶斯信息标准(BIC),指定为标量。BIC = 2*NlogL + p*log(n),在那里NlogL负对数似然(theNegativeLogLikelihood财产),N.是观察的次数,和P.为估计参数的个数。

BIC是一个模型选择工具,您可以使用它来比较适合同一数据的多个模型。BIC是一种基于概率的模型拟合度量,它包含了复杂性的惩罚,特别是参数的数量。当比较多个模型时,BIC值最低的模型是最佳拟合模型。

如果您创建一个,则此属性是空的GMDistribution.通过使用的对象GMDistribution.函数。

数据类型:|

此属性是只读的。

表示拟合高斯混合模型时EM算法是否收敛的标志,指定为真正的错误的

属性可以更改优化选项“选项”名称 - 值对参数fitgmdist

如果您创建一个,则此属性是空的GMDistribution.通过使用的对象GMDistribution.函数。

数据类型:逻辑

此属性是只读的。

给定输入数据的拟合高斯混合模型的负对数似然Xfitgmdist,指定为标量。

如果您创建一个,则此属性是空的GMDistribution.通过使用的对象GMDistribution.函数。

数据类型:|

此属性是只读的。

EM (Expectation-Maximization)算法的迭代次数,指定为正整数。

您可以使用使用的更改优化选项,包括允许的最大迭代次数“选项”名称 - 值对参数fitgmdist

如果您创建一个,则此属性是空的GMDistribution.通过使用的对象GMDistribution.函数。

数据类型:

此属性是只读的。

后验概率的公差,指定为范围内的非负标量值[0,1 e-6]

“ProbabilityTolerance”名称 - 值对参数fitgmdist设置此属性。

如果您创建一个,则此属性是空的GMDistribution.通过使用的对象GMDistribution.函数。

数据类型:|

此属性是只读的。

正则化参数值,指定为非负标量。

'正规化值'名称 - 值对参数fitgmdist设置此属性。

如果您创建一个,则此属性是空的GMDistribution.通过使用的对象GMDistribution.函数。

数据类型:|

对象功能

CDF. 高斯混合分布的累积分布函数
集群 构建高斯混合分布的群集
泰姬陵 Mahalanobis距离高斯混合组件
PDF. 高斯混合分布的概率密度函数
后面 高斯混合组分的后概率
随机的 随机变量来自高斯混合分布

例子

全部收缩

通过使用来创建双组分双变量高斯混合混合物分布GMDistribution.函数。

定义两个双变量高斯混合组分的分布参数(手段和协方差)。

mu = [1 2; -3 -5];西格玛=猫(3,[2 .5],[1 1])% 1-by-2-by-2数组
Sigma = Sigma(:,:,1)= 2.0000 0.5000 sigma(:,:,2)= 1 1

函数沿着第三个数组维连接协方差。定义的协方差矩阵是对角矩阵。σ(1:我)包含组件的协方差矩阵的对角线元素一世

创建一个GMDistribution.对象。默认情况下,GMDistribution.功能造成相同的比例混合物。

通用= gmdistribution(μ、σ)
GM =高斯混合物分布,2个尺寸组分中的2个组分组分1:混合比例:0.500000平均值:1 2组分2:混合比例:0.500000平均值:-3 -5

列出属性GM.对象。

属性(通用)
类Gmdistribution的属性:NumVariables分发NumComponents ComponentPropoft SharedCovariance Numiterations正规化值Negativeloglikelious CovariAceType Mu Sigma AIC BIC融合概率特定

您可以使用点表示法访问这些属性。例如,访问组成份额属性,代表混合物组分的混合比例。

gm.ComponentProportion
ans =.1×20.5000 - 0.5000

一种GMDistribution.对象具有仅适用于合适对象的属性。所拟合的对象属性为AIC.BIC.聚合NegativeLogLikelihoodNumIterationsProbabilityTolerance, 和正规化值.如果使用该对象创建对象,则拟合对象属性的值是空的GMDistribution.函数和指定分布参数。例如,访问NegativeLogLikelihood使用点表示法。

gm.negativeloglikelihie
ans = []

创建一个后GMDistribution.对象,您可以使用对象函数。用CDF.PDF.计算累积分布函数(CDF)和概率密度函数(PDF)的值。用随机的生成随机向量。用集群泰姬陵, 和后面用于集群分析。

通过使用可视化对象PDF.FSURF.

gmPDF = @ (x, y) arrayfun (@ (x0, y0) pdf(通用、(x0 y0)), x, y);fsurf (gmPDF 10 [-10])

图中包含一个坐标轴。轴包含类型函数曲面的对象。

通过使用使用的遵循两种双变量高斯分布的混合的随机变体mvnrnd函数。对生成的数据拟合高斯混合模型(GMM)fitgmdist函数。

定义两个双变量高斯混合组分的分布参数(手段和协方差)。

Mu1 = [1 2];第1分量的平均值sigma1 = [2 0;0。5];第一组分的%协方差mu2 = [-3 -5];第二组分的%平均值sigma2 = [1 0;0 1];第二分量的协方差

生成来自每个组件的相同数量的随机变体,并组合两组随机变体。

RNG('默认'重复性的%R1 = MVNRND(MU1,Sigma1,1000);r2 = mvnrnd(mu2,sigma2,1000);x = [R1;R2];

组合数据集X包含两个二元高斯分布混合的随机变量。

适合双组分GMMX

gm = fitgmdist(x,2)
GM =高斯混合物分布在2尺寸组件1:混合比例:0.500000平均值:-2.9617 -4.9727组件2:混合比例:0.500000平均值:0.9539 2.0261

列出属性GM.对象。

属性(通用)
类Gmdistribution的属性:NumVariables分发NumComponents ComponentPropoft SharedCovariance Numiterations正规化值Negativeloglikelious CovariAceType Mu Sigma AIC BIC融合概率特定

您可以使用点表示法访问这些属性。例如,访问NegativeLogLikelihood属性,它代表数据的负值逻辑X鉴于拟合模型。

gm.negativeloglikelihie
ans = 7.0584e + 03

创建一个后GMDistribution.对象,您可以使用对象函数。用CDF.PDF.计算累积分布函数(CDF)和概率密度函数(PDF)的值。用随机的生成随机变体。用集群泰姬陵, 和后面用于集群分析。

阴谋X通过使用分散.可视化拟合模型GM.通过使用PDF.Fcontour.

散射(x(:,1),x(:,2),10,'。'%散射图,尺寸为10抓住gmPDF = @ (x, y) arrayfun (@ (x0, y0) pdf(通用、(x0 y0)), x, y);fcontour (gmPDF 6 [8])

图中包含一个坐标轴。坐标轴包含离散型、功能轮廓型2个对象。

参考

[1] McLachlan,G.和D. Peel。有限混合模型.Hoboken,NJ:John Wiley&Sons,Inc。,2000。

在R2007B中介绍