簇

利用高斯混合分布构造聚类

折叠所有页面

语法

idx=群集（gm，X）

[idx，nlogL]=集群（gm，X）

[idx，nlogL，P]=簇（gm，X）

[idx，nlogL，P，logpdf]=集群（gm，X）

[idx，nlogL，P，logpdf，d2]=集群（gm，X）

描述

实例

idx=群集(转基因的,X)将数据划分为X进入K由K图像中的高斯混合分量转基因的.价值idx（一）是观察的聚类指数我并指出给定观测值后验概率最大的分量我.

[idx,nlogL]=群集(转基因的,X)还返回高斯混合模型的负对数似然转基因的根据数据X.

[idx,nlogL,P]=群集(转基因的,X)还返回中每个高斯混合成分的后验概率转基因的给出每一个观察结果X.

[idx,nlogL,P,日志PDF]=群集(转基因的,X)还返回在中的每个观测值处计算的估计概率密度函数（pdf）的对数X.

[idx,nlogL,P,日志PDF,d2]=群集(转基因的,X)还返回中每个观测值的马氏距离平方X到中的每个高斯混合分量转基因的.

例子

全部崩溃

群集数据

打开实时脚本

通过使用mvnrnd函数。使用fitgmdist函数。然后，使用簇函数将数据划分为由拟合的GMM组件确定的两个簇。

定义两个二元高斯混合分量的分布参数（均值和协方差）。

mu1=[2]；%第一分量的平均值sigma1=[20；01]；%第一分量的协方差mu2=[-2-1]；%第二分量的平均值sigma2=[10；01]；%第二分量的协方差

从每个组件生成相等数量的随机变量，并将两组随机变量组合在一起。

rng(“默认”)%为了再现性r1=mvnrnd（mu1，sigma11000）；r2=mvnrnd（mu2，sigma21000）；X=[r1；r2]；

组合数据集X包含两个二元高斯分布混合后的随机变量。

将双组分GMM安装到X.

gm=fitgmdist（X，2）；

情节X利用分散.可视化安装的模型转基因的利用pdf和福康图尔.

数字散点（X（：，1），X（：，2），10，'.')%点大小为10的散点图持有在…上gmPDF=@（x，y）arrayfun（@（x0，y0）pdf（gm，[x0-y0]），x，y）；fcontour（gmPDF，[-68-46]）

图中包含一个Axis对象。Axis对象包含两个类型为District、functioncontour的对象。

通过将拟合的GMM和数据传递给簇.

idx=簇（gm，X）；

使用gscatter创建按分组的散点图的步骤idx.

图；gscatter（X（：，1），X（：，2），idx）；图例(“集群1”,“集群2”,“位置”,“最好的”);

图中包含一个Axis对象。Axis对象包含2个line类型的对象。这些对象表示簇1和簇2。

输入参数

全部崩溃

`转基因的`—高斯混合分布
`gm分布`对象

高斯混合分布，也称为高斯混合模型（GMM），指定为gm分布对象

您可以创建一个gm分布对象使用gm分布或fitgmdist.使用gm分布函数创建一个gm分布对象。请使用fitgmdist功能适合gm分布给定固定数量组件的数据模型。

`X`—数据
N-借-M数值矩阵

数据，指定为N-借-M数字矩阵，其中N是观察次数和M是每个观察中的变量数。

为了提供有意义的聚类结果，X必须与用于创建的数据来自同一人群转基因的.

如果一排X包含南斯然后簇从计算中排除该行。中的对应值idx,P,日志PDF和d2是楠.

数据类型：仅有一个的|双重的

输出参数

全部崩溃

`idx`-聚类指数
N-by-1正整数向量

群集索引，作为N-by-1正整数向量，其中N是中的观察数X.

idx（一）是观察的聚类指数我并指出给定观测值后验概率最大的高斯混合分量我.

`nlogL`-负对数似然
数值

高斯混合模型的负对数似然值转基因的根据数据X，以数值形式返回。

`P`-后验概率
N-借-K数值向量

模型中各高斯混合分量的后验概率转基因的给出每一个观察结果X，以N-借-K数字向量，其中N是中的观察数X和K是中混合物成分的数量转基因的.

P（i，j）是该事件的后验概率J给定观测值的高斯混合分量我，概率（分量）J|观察我).

`日志PDF`-估计pdf的对数
N-by-1数字向量

估计pdf的对数，在中的每次观察中进行评估X，以N-by-1数值向量，其中N是中的观察数X.

日志PDF（i）是观察时估计pdf的对数我这个簇函数通过使用给定每个观测值的每个分量的可能性和分量概率来计算估计的pdf。

$日志PDF (我) = 日志 \sum_{J = 1.}^{K} L (C_{J} | O_{我}) P (C_{J}),$

哪里L(C_J|O_J)是组件的可能性J观察我和P(C_J)是组件的概率J这个簇函数使用函数的多元正态pdf计算似然项J观测时评估的th高斯混合分量我. 组分概率是混合物组分的混合比例成分比例性质转基因的.

`d2`-平方马氏距离
N-借-K数值矩阵

中每个观测值的马氏距离平方X到中的每个高斯混合分量转基因的，以N-借-K数字矩阵，其中N是中的观察数X和K是中混合物成分的数量转基因的.

d2（i，j）是观察距离的平方我到J高斯混合分量。

另见

fitgmdist|gm分布|玛哈尔|后面的

话题

在R2007b中引入

统计和机器学习工具箱文档

金宝app

掌握机器学习：用MATLAB逐步指导

下载电子书

簇

语法

描述

例子

群集数据

输入参数

转基因的—高斯混合分布gm分布对象

X—数据N-借-M数值矩阵

输出参数

idx-聚类指数N-by-1正整数向量

nlogL-负对数似然数值

P-后验概率N-借-K数值向量

日志PDF-估计pdf的对数N-by-1数字向量

d2-平方马氏距离N-借-K数值矩阵

另见

话题

统计和机器学习工具箱文档

金宝app

掌握机器学习：用MATLAB逐步指导

`转基因的`—高斯混合分布
`gm分布`对象

`X`—数据
N-借-M数值矩阵

`idx`-聚类指数
N-by-1正整数向量

`nlogL`-负对数似然
数值

`P`-后验概率
N-借-K数值向量

`日志PDF`-估计pdf的对数
N-by-1数字向量

`d2`-平方马氏距离
N-借-K数值矩阵