问题在烧结的分层集群,距离矩阵元素超过最大允许大小在MATLAB。

5视图(30天)
在matlab /文档,我们可以做分层clusteringhierarchical聚类是这样的:
Y = pdist (X)
Z =连杆(Y)
T =集群(Z,“截止”,1.2)
我的数据集有50663个样本。我不能加载整个数据集,因为每个样本都有~ 500000的特性。首先我计算距离矩阵的平方形式2样品一次克服内存问题。然后我vectorize距离下三角矩阵((:)),这将产生相同的输出作为pdist (Y在上面的例子中,大小1283344453)。
当我试着申请链接我得到错误“距离矩阵元素超过最大允许大小在MATLAB”。
1)的距离矩阵和矢量化的形式都是加载在我的空间,所以....没有
2)它要计算一个新的距离矩阵基于1283344453元素的区别?文档没有说加载squareform距离矩阵。
我迷路了。我唯一能绕过我的数据集的大小是使用距离矩阵,而不是实际的数据。任何想法,我们将不胜感激。

答案(1)

迈克尔·摩尔
迈克尔·摩尔 2022年8月15日
链接函数期望一个行向量,如果你把它一个列向量得到这个警告。尝试通过连杆函数向量的转置。

下载188bet金宝搏


释放

R2019a

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!