什么距离度量在基于内容的推荐系统上表现良好



我想实现一个基于内容的推荐系统,该系统根据用户输入提供推荐书籍的列表。

我将使用TF-IDF来确定一个单词对一本书的重要性,并为每本书创建一个图书特征向量。

我需要创建一个相似性矩阵来确定可能的一对书。我就是因为这样做才遇到欧几里得距离的。还有比欧几里得更好的方法吗?

以下是一些不错的距离测量方法,您可以尝试:

  • (广义)Jaccard距离
  • 曼哈顿距离
  • Hellinger距离
  • 余弦相似性

最新更新