r语言 - 距离函数中不允许使用负长度向量



我有一个大数据框(375,000行和5列(,所有变量都是数字。我想在 R 中使用分层聚类对这个数据框进行时空聚类。但是,当我尝试计算距离矩阵时,出现以下错误:"距离函数中不允许负长度向量"。是因为超过了计算机的最大内存(16 GB RAM(吗?还是由于超过了 R 中任何向量的最大长度,即 2^31 - 1(约 20 亿个(元素?顺便问一下,如何计算我尝试计算的这个距离矩阵的长度?是375,000^2等于近1000亿吗? 无论如何,我能对这个问题做些什么?在这种情况下,我还能以某种方式使用分层聚类吗?

使用 kmeans 进行聚类效果很好,但我的主管更喜欢分层聚类。

任何提示/建议将不胜感激

P.S. 行表示车辆行程 ID,列表示:起点的经度、起点的纬度、终点的经度、终点的纬度和特定日期的行程时间(所有值都针对所有变量进行缩放(。

是的,375000^2 超过了向量的长度。

矩阵的大小大致为行 * 列 * 数据类型的大小。

计算您需要的内存量,然后返回您的主管并将该结果返回给您的主管。

最新更新