如何在 HAC 中聚类某些对象,但它们具有相同的余弦相似性值



我想将对象 A 与对象 B 或对象 C 聚类。但是具有对象 B 的余弦相似性对象 A 的值为 0,具有对象 C 的余弦相似性对象 A 的值为 0。在直接聚类之前,我需要逐个词干聚类这些对象,哪个对象应该先组合 对象 A 与 B 或对象 A 与 C 组合?

对于余弦相似性,您可能希望停在 0...

但是,当然,任何距离函数也可能会出现领带问题。

但显然没有数学答案。他们都同样好。通常,人们希望顺序无关紧要。对于一个,它没有,但对于所有其他它有。不要忘记,HAC不能保证找到最佳解决方案(单链路除外(。

因此,只需选择任何一项,甚至一次全部选择。选择第一个找到的是相当普遍的。这允许通过随机播放数据来获取不同的版本。

最新更新