gmdistribution
创建高斯混合模型
描述
一个gmdistribution
对象存储一个高斯混合分布,也称为高斯混合模型(GMM),它是一个由多元高斯分布分量组成的多元分布。每个分量由其均值和协方差定义。混合物由混合比例的矢量定义,其中每个混合比例代表由相应成分描述的总体的分数。
创建
您可以创建gmdistribution
用两种方法建模对象。
使用
gmdistribution
函数(此处描述)来创建gmdistribution
通过指定分布参数对对象进行建模。使用
fitgmdist
函数拟合gmdistribution
将对象建模为给定固定数量的组件的数据。
描述
输入参数
μ
- - - - - -意味着
k——- - - - - -米数字矩阵
多元高斯分布分量的均值,用a表示k——- - - - - -米数字矩阵,k是元器件的数量和米是每个组件中变量的数量。μ(我,:)
分量的均值是多少我
.
数据类型:单
|双
σ
- - - - - -协方差
数值向量|数字矩阵|数字数组
多元高斯分布分量的协方差,以数值矢量、矩阵或数组表示。
考虑到k是元器件的数量和米是每个分量中变量的数量,σ
是此表中的值之一。
价值 | 描述 |
---|---|
米——- - - - - -米——- - - - - -k数组 | σ(:,:,我) 分量的协方差矩阵是我 . |
1 -米——- - - - - -k数组 | 协方差矩阵是对角线的。σ(1:我) 包含分量协方差矩阵的对角线元素我 . |
米——- - - - - -米矩阵 | 协方差矩阵在不同分量上是相同的。 |
1 -米向量 | 协方差矩阵是对角线的,在各分量之间也是一样的。 |
数据类型:单
|双
p
- - - - - -混合组分的混合比例
数字长度向量k
混合成分的混合比例,以长度的数字矢量表示k,在那里k是分量的数量。默认值是(1/)的行向量k)s,设定相等的比例。如果p
不等于1
,gmdistribution
使它规范化。
数据类型:单
|双
属性
分布参数
σ
- - - - - -协方差
数值向量|数字矩阵|数字数组
此属性是只读的。
多元高斯分布分量的协方差,以数值矢量、矩阵或数组表示。
考虑到k是元器件的数量和米是每个分量中变量的数量,σ
是此表中的值之一。
价值 | 描述 |
---|---|
米——- - - - - -米——- - - - - -k数组 | σ(:,:,我) 分量的协方差矩阵是我 . |
1 -米——- - - - - -k数组 | 协方差矩阵是对角线的。σ(1:我) 包含分量协方差矩阵的对角线元素我 . |
米——- - - - - -米矩阵 | 协方差矩阵在不同分量上是相同的。 |
1 -米向量 | 协方差矩阵是对角线的,在各分量之间也是一样的。 |
数据类型:单
|双
分布特征
CovarianceType
- - - - - -协方差矩阵的类型
“对角线”
|“全部”
此属性是只读的。
协方差矩阵的类型,指定为任意一种“对角线”
或“全部”
.
如果你创建一个
gmdistribution
对象,使用gmdistribution
函数,那么协方差矩阵的类型σ
的输入参数gmdistribution
设置此属性。如果你适合
gmdistribution
对象转换为数据fitgmdist
函数,然后“CovarianceType”
的名称-值对参数fitgmdist
设置此属性。
DistributionName
- - - - - -分布的名字
“高斯混合分布”
(默认)
此属性是只读的。
发行版名称,指定为“高斯混合分布”
.
SharedCovariance
- - - - - -表示共享协方差的标志
真正的
|假
此属性是只读的。
标志,指示是否在混合成分之间共享协方差矩阵,指定为真正的
或假
.
如果你创建一个
gmdistribution
对象,使用gmdistribution
函数,那么协方差矩阵的类型σ
的输入参数gmdistribution
设置此属性。如果你适合
gmdistribution
对象转换为数据fitgmdist
函数,然后“SharedCovariance”
的名称-值对参数fitgmdist
设置此属性。
数据类型:逻辑
拟合对象的属性
以下属性仅适用于使用创建的拟合对象fitgmdist
.属性时,这些属性的值为空gmdistribution
对象,使用gmdistribution
函数。
另类投资会议
- - - - - -赤池信息标准
标量
此属性是只读的。
赤池信息准则(AIC),指定为标量。AIC = 2*NlogL + 2*p
,在那里NlogL
负对数似然(theNegativeLogLikelihood
属性)和p
是估计参数的个数。
AIC是一个模型选择工具,可以用来比较适合相同数据的多个模型。AIC是一种基于可能性的模型拟合度量,包括对复杂性的惩罚,特别是参数的数量。当您比较多个模型时,AIC值越小的模型越好。
属性时,此属性为空gmdistribution
对象,使用gmdistribution
函数。
数据类型:单
|双
BIC
- - - - - -贝叶斯信息准则
标量
此属性是只读的。
贝叶斯信息准则(BIC),指定为标量。BIC = 2*NlogL + p*log(n)
,在那里NlogL
负对数似然(theNegativeLogLikelihood
属性),n
是观察数,和p
是估计参数的个数。
BIC是一个模型选择工具,可以用来比较适合相同数据的多个模型。BIC是一种基于可能性的模型拟合度量,包括对复杂性的惩罚,特别是参数的数量。当您比较多个模型时,BIC值最低的模型是最佳拟合模型。
属性时,此属性为空gmdistribution
对象,使用gmdistribution
函数。
数据类型:单
|双
聚合
- - - - - -收敛标志
真正的
|假
此属性是只读的。
标志,指示拟合高斯混合模型时期望最大化(EM)算法是否收敛,指定为真正的
或假
.
控件可以更改优化选项“选项”
的名称-值对参数fitgmdist
.
属性时,此属性为空gmdistribution
对象,使用gmdistribution
函数。
数据类型:逻辑
NegativeLogLikelihood
- - - - - -负loglikelihood
标量
此属性是只读的。
给定输入数据,拟合高斯混合模型的负对数似然X
的fitgmdist
,指定为标量。
属性时,此属性为空gmdistribution
对象,使用gmdistribution
函数。
数据类型:单
|双
NumIterations
- - - - - -迭代次数
正整数
此属性是只读的。
期望-最大化(EM)算法中的迭代次数,指定为正整数。
属性可以更改优化选项,包括允许的最大迭代次数“选项”
的名称-值对参数fitgmdist
.
属性时,此属性为空gmdistribution
对象,使用gmdistribution
函数。
数据类型:双
ProbabilityTolerance
- - - - - -后验概率的容忍度
范围内的非负标量值[0,1 e-6]
此属性是只读的。
后验概率的容差,指定为范围内的非负标量值[0,1 e-6]
.
的“ProbabilityTolerance”
的名称-值对参数fitgmdist
设置此属性。
属性时,此属性为空gmdistribution
对象,使用gmdistribution
函数。
数据类型:单
|双
RegularizationValue
- - - - - -正则化参数值
负的标量
此属性是只读的。
正则化参数值,指定为非负标量。
的“RegularizationValue”
的名称-值对参数fitgmdist
设置此属性。
属性时,此属性为空gmdistribution
对象,使用gmdistribution
函数。
数据类型:单
|双
对象的功能
例子
创建高斯混合分布使用gmdistribution
函数创建一个双组分二元高斯混合分布gmdistribution
函数。
定义两个二元高斯混合分量的分布参数(均值和协方差)。
Mu = [1 2;-3 -5];Sigma = cat(3,[2 .5],[1 1])% 1 × 2 × 2数组
σ=σ(:,:1)= 2.0000 - 0.5000σ(:,:2)= 1 1
的猫
函数沿第三个数组维度连接协方差。所定义的协方差矩阵是对角矩阵。σ(1:我)
包含分量协方差矩阵的对角线元素我
.
创建一个gmdistribution
对象。默认情况下,gmdistribution
函数产生了等比例的混合物。
Gm = gmdistribution(mu,sigma)
gm =二维2组分高斯混合分布组件1:混合比例:0.500000均值:1 2组件2:混合比例:0.500000均值:-3 -5
属性的属性通用汽车
对象。
属性(通用)
类gmdistribution的属性:NumVariables DistributionName NumComponents ComponentProportion SharedCovariance NumIterations RegularizationValue NegativeLogLikelihood CovarianceType mu Sigma AIC BIC收敛概率公差
您可以使用点表示法来访问这些属性。例如,访问ComponentProportion
属性,表示混合物组分的混合比例。
gm.ComponentProportion
ans =1×20.5000 - 0.5000
一个gmdistribution
对象具有仅适用于拟合对象的属性。拟合对象属性为另类投资会议
,BIC
,聚合
,NegativeLogLikelihood
,NumIterations
,ProbabilityTolerance
,RegularizationValue
.类创建对象时,拟合对象属性的值为空gmdistribution
函数并指定分布参数。例如,访问NegativeLogLikelihood
属性。
gm.NegativeLogLikelihood
Ans = []
在创建一个gmdistribution
对象,可以使用对象函数。使用提供
而且pdf
计算累积分布函数(cdf)和概率密度函数(pdf)的值。使用随机
生成随机向量。使用集群
,泰姬陵
,后
用于聚类分析。
gmPDF = @ (x, y) arrayfun (@ (x0, y0) pdf(通用、(x0 y0)), x, y);fsurf (gmPDF 10 [-10])
用高斯混合模型拟合数据fitgmdist
生成遵循两个二元高斯分布的混合的随机变量mvnrnd
函数。对生成的数据拟合高斯混合模型(GMM)fitgmdist
函数。
定义两个二元高斯混合分量的分布参数(均值和协方差)。
Mu1 = [1 2];第一个分量的均值Sigma1 = [2 0;0。5);第一个分量的协方差%Mu2 = [-3 -5];%第二分量的均值Sigma2 = [10 0;0 1];第二分量的协方差%
从每个组件中生成相等数量的随机变量,并将两组随机变量组合在一起。
rng (“默认”)%用于再现性R1 = mvnrnd(mu1,sigma1,1000);R2 = mvnrnd(mu2,sigma2,1000);X = [r1;r2);
组合数据集X
包含随机变量,遵循两个二元高斯分布的混合。
适合一个双分量GMMX
.
gm = fitgmdist(X,2)
gm =二维2组分高斯混合分布组件1:混合比例:0.500000均值:-2.9617 -4.9727组件2:混合比例:0.500000均值:0.9539 2.0261
属性的属性通用汽车
对象。
属性(通用)
类gmdistribution的属性:NumVariables DistributionName NumComponents ComponentProportion SharedCovariance NumIterations RegularizationValue NegativeLogLikelihood CovarianceType mu Sigma AIC BIC收敛概率公差
您可以使用点表示法来访问这些属性。例如,访问NegativeLogLikelihood
属性,该属性表示数据的负对数似然X
给定拟合模型。
gm.NegativeLogLikelihood
Ans = 7.0584e+03
在创建一个gmdistribution
对象,可以使用对象函数。使用提供
而且pdf
计算累积分布函数(cdf)和概率密度函数(pdf)的值。使用随机
生成随机变量。使用集群
,泰姬陵
,后
用于聚类分析。
情节X
通过使用散射
.可视化拟合模型通用汽车
通过使用pdf
而且fcontour
.
散射(X (: 1) X(:, 2), 10日“。”)%大小为10的点的散点图持有在gmPDF = @ (x, y) arrayfun (@ (x0, y0) pdf(通用、(x0 y0)), x, y);fcontour (gmPDF 6 [8])
参考文献
[1] G.麦克拉克兰和D.皮尔。有限混合模型.霍博肯,新泽西州:约翰·威利父子公司,2000年。
版本历史
在R2007b中引入
MATLAB命令
你点击了一个对应于这个MATLAB命令的链接:
在MATLAB命令窗口中输入该命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。