TF-IDF 分数计算示例



我想计算集群中已经存在许多句子的句子的tf-idf分数。我已经看到一些例子,其中只有两句话作为例子。但我需要两句话以上。谁能帮我??

TF-IDF是在两个文档或句子(两个单词向量)上定义的。您似乎想以一对多的方式应用它?

对此没有理论上支持的方法。但是您可以使用HAC中常见的任何启发式方法,因为这似乎是您正在重新发明的。

最新更新