问题在烧结的分层集群,距离矩阵元素超过最大允许大小在MATLAB。
5视图(30天)
显示旧的评论
在matlab /文档,我们可以做分层clusteringhierarchical聚类是这样的:
Y = pdist (X)
Z =连杆(Y)
T =集群(Z,“截止”,1.2)
我的数据集有50663个样本。我不能加载整个数据集,因为每个样本都有~ 500000的特性。首先我计算距离矩阵的平方形式2样品一次克服内存问题。然后我vectorize距离下三角矩阵((:)),这将产生相同的输出作为pdist (Y在上面的例子中,大小1283344453)。
当我试着申请链接我得到错误“距离矩阵元素超过最大允许大小在MATLAB”。
1)的距离矩阵和矢量化的形式都是加载在我的空间,所以....没有
2)它要计算一个新的距离矩阵基于1283344453元素的区别?文档没有说加载squareform距离矩阵。
我迷路了。我唯一能绕过我的数据集的大小是使用距离矩阵,而不是实际的数据。任何想法,我们将不胜感激。