集群的数据使用k-表示实时编辑器中的算法
的集群的数据活动编辑器任务使您能够交互式地执行k——集群。任务生成MATLAB®为您的活动脚本编写代码,并将结果集群索引和集群质心位置返回到MATLAB工作区。
您可以:
通过选择集群数量手动确定数据的最佳集群数量,或者通过指定标准(如间隙值、轮廓值、Davies-Bouldin索引值和Calinski-Harabasz索引值)自动确定数据的最佳集群数量。
自定义群集数据的参数,包括距离度量和重复次数。
自动可视化集群数据。
有关实时编辑器任务的一般信息,请参见向活动脚本添加交互式任务.
添加集群的数据任务到现场脚本:
在住编辑器选项卡上,选择任务>集群的数据.
在活动脚本的代码块中,键入相关的关键字,例如聚类
或kmeans
.选择集群的数据从建议的命令完成。
输入数据
—数据到集群通过从可用的工作区变量中选择一个变量来指定要集群的数据。变量必须是出现在列表中的数字矩阵。
选择方法
-聚类选择法手册
(默认)|最优
指定用于确定数据的最佳集群数量的方法。
手册
—手动指定要将数据分组到的集群数量。
最优
——使用evalclusters
函数根据间隙值、剪影值、Davies-Bouldin指数和Calinski-Harabasz指数等准则来寻找最优簇数。
范围
—待评估的集群数量列表2:5
(默认)|最小值和最大正整数值将要计算的集群数量列表指定为由最小值和最大值组成的范围。例如,如果指定的最小值为2
最大值为6
,该任务评估集群2、3、4、5和6的数量,以确定最优数量。
情节展示
-显示结果的图表要显示集群数据,请从可用选项中选择:
选择2D散点图(PCA)以在二维散点图中显示聚集数据的主分量。的集群的数据任务使用gscatter
函数创建散点图。
选择散点图矩阵以散点图矩阵显示聚类数据。当您选择散点图矩阵时,复选框右侧将显示一个列表。列表中的每一项表示指定输入数据中的一列。按下Ctrl键并从列表中选择最多4个输入数据列。的集群的数据任务使用主成分分析
和gplotmatrix
函数从选定的列创建散点图的矩阵。
矩阵中的散点图在集群索引中比较选定的输入数据列。矩阵中的对角线图是直方图,显示了每个聚类指数的选定列的分布。
默认情况下,集群的数据修改任务参数时,任务不会自动运行。要使任务在任何更改之后自动运行,请选择自动运行按钮位于任务的右上方。如果您的数据集较大,请不要启用此选项。