主要内容

利用高斯混合分布构造聚类

描述

实例

idx=群集(转基因的,X)将数据划分为X进入KK图像中的高斯混合分量转基因的.价值idx(一)是观察的聚类指数并指出给定观测值后验概率最大的分量.

[idx,nlogL]=群集(转基因的,X)还返回高斯混合模型的负对数似然转基因的根据数据X.

[idx,nlogL,P]=群集(转基因的,X)还返回中每个高斯混合成分的后验概率转基因的给出每一个观察结果X.

[idx,nlogL,P,日志PDF]=群集(转基因的,X)还返回在中的每个观测值处计算的估计概率密度函数(pdf)的对数X.

[idx,nlogL,P,日志PDF,d2]=群集(转基因的,X)还返回中每个观测值的马氏距离平方X到中的每个高斯混合分量转基因的.

例子

全部崩溃

通过使用mvnrnd函数。使用fitgmdist函数。然后,使用函数将数据划分为由拟合的GMM组件确定的两个簇。

定义两个二元高斯混合分量的分布参数(均值和协方差)。

mu1=[2];%第一分量的平均值sigma1=[20;01];%第一分量的协方差mu2=[-2-1];%第二分量的平均值sigma2=[10;01];%第二分量的协方差

从每个组件生成相等数量的随机变量,并将两组随机变量组合在一起。

rng(“默认”)%为了再现性r1=mvnrnd(mu1,sigma11000);r2=mvnrnd(mu2,sigma21000);X=[r1;r2];

组合数据集X包含两个二元高斯分布混合后的随机变量。

将双组分GMM安装到X.

gm=fitgmdist(X,2);

情节X利用分散.可视化安装的模型转基因的利用pdf福康图尔.

数字散点(X(:,1),X(:,2),10,'.')%点大小为10的散点图持有在…上gmPDF=@(x,y)arrayfun(@(x0,y0)pdf(gm,[x0-y0]),x,y);fcontour(gmPDF,[-68-46])

图中包含一个Axis对象。Axis对象包含两个类型为District、functioncontour的对象。

通过将拟合的GMM和数据传递给.

idx=簇(gm,X);

使用gscatter创建按分组的散点图的步骤idx.

图;gscatter(X(:,1),X(:,2),idx);图例(“集群1”,“集群2”,“位置”,“最好的”);

图中包含一个Axis对象。Axis对象包含2个line类型的对象。这些对象表示簇1和簇2。

输入参数

全部崩溃

高斯混合分布,也称为高斯混合模型(GMM),指定为gm分布对象

您可以创建一个gm分布对象使用gm分布fitgmdist.使用gm分布函数创建一个gm分布对象。请使用fitgmdist功能适合gm分布给定固定数量组件的数据模型。

数据,指定为N-借-M数字矩阵,其中N是观察次数和M是每个观察中的变量数。

为了提供有意义的聚类结果,X必须与用于创建的数据来自同一人群转基因的.

如果一排X包含南斯然后从计算中排除该行。中的对应值idx,P,日志PDFd2.

数据类型:仅有一个的|双重的

输出参数

全部崩溃

群集索引,作为N-by-1正整数向量,其中N是中的观察数X.

idx(一)是观察的聚类指数并指出给定观测值后验概率最大的高斯混合分量.

高斯混合模型的负对数似然值转基因的根据数据X,以数值形式返回。

模型中各高斯混合分量的后验概率转基因的给出每一个观察结果X,以N-借-K数字向量,其中N是中的观察数XK是中混合物成分的数量转基因的.

P(i,j)是该事件的后验概率J给定观测值的高斯混合分量,概率(分量)J|观察).

估计pdf的对数,在中的每次观察中进行评估X,以N-by-1数值向量,其中N是中的观察数X.

日志PDF(i)是观察时估计pdf的对数这个函数通过使用给定每个观测值的每个分量的可能性和分量概率来计算估计的pdf。

日志PDF ( ) = 日志 J = 1. K L ( C J | O ) P ( C J ) ,

哪里L(CJ|OJ)是组件的可能性J观察P(CJ)是组件的概率J这个函数使用函数的多元正态pdf计算似然项J观测时评估的th高斯混合分量. 组分概率是混合物组分的混合比例成分比例性质转基因的.

中每个观测值的马氏距离平方X到中的每个高斯混合分量转基因的,以N-借-K数字矩阵,其中N是中的观察数XK是中混合物成分的数量转基因的.

d2(i,j)是观察距离的平方J高斯混合分量。

在R2007b中引入