我想实现一个基于内容的推荐系统,该系统根据用户输入提供推荐书籍的列表。
我将使用TF-IDF来确定一个单词对一本书的重要性,并为每本书创建一个图书特征向量。
我需要创建一个相似性矩阵来确定可能的一对书。我就是因为这样做才遇到欧几里得距离的。还有比欧几里得更好的方法吗?
以下是一些不错的距离测量方法,您可以尝试:
- (广义)Jaccard距离
- 曼哈顿距离
- Hellinger距离
- 余弦相似性