r-查找最相似的样本集–一个查找给定大小的聚类的函数



我需要找到一个具有特定数量成员的集群。如果我有任意数量样本的距离数据,我想找到在聚集聚类过程中三个位置聚集的第一个发生率。在其他方面,我想找到最相似的三个样本集。

CCD_ 1通过凝聚为我提供了尺寸为3的团簇,但它必须通过CCD_。

我可以创建一个函数,使用hclust()$merge输出来查找具有三个成员的集群聚集期间的第一个事件,但我想知道这样的函数是否已经存在。

使用聚类函数处理这一问题很可能不是正确的方法。

试着从不同的角度来解决这个问题。

例如,可以查找到第二个最近邻居的距离,然后选择该距离最小的对象。

这不一定会给你同样的结果,但应该会快得多。

或者您自己实现分层集群(它不是很复杂),这样当第一个集群具有所需的大小时,您就可以提前停止。

最新更新