谁能指导我阅读有关PageRank和术语频率-反向文档频率比较的任何学术论文。我一直在搜索,我只是找到关于将两者结合起来的论文。
我需要找到页面排名相对于 TF-IDF 的优势
虽然PageRank和TF-IDF都用于排名,但它们用于非常不同类型的排名。
PageRank根据文档链接到的文档以及链接到文档的文档为文档分配分数。分数不会因使用的查询而异(即它是一个全球排名方案(。
TF-IDF 用于根据某些查询为文档评分。分数根据查询而变化,没有查询就没有分数。
你之所以发现很多论文讨论将两者结合起来,而不讨论它们的不同优势,是因为它们在这种方式上没有真正的可比性。这在很大程度上是苹果和橙子的情况。