Scikit学习，为用户找到新音乐

我想编写一个程序，该程序将为用户找到新音乐，只有用户的计算机中的音乐。

对于用户计算机上的每位艺术家，我将创建带有歌曲中的单词的新列表。（当然删除停止字）

例如：{'plotbo'：{'secret'：11，'Unicorn'：8，'Helmet'：6}}和其他单词

然后，我想使用DICTVECTORIZER将我的列表转换为numpy阵列或scipy.sparse矩阵，供Scikit-Learn估计器。

例如，上面将是-array（[[11.，8。，6。]）

所以，对于用户计算机上的每个艺术家，我都有列表。

此外，我有1000名艺术家的数据库，对于每位艺术家，我也都有这种类型的列表。

现在，我不知道找到与用户所拥有的艺术家的最佳方法是什么。

也许Scikit-Learn中有一些内置功能？

Scikit-Learn中没有内置的推荐系统。但是，您可以使用最近的邻居分类器。查看GraphLab.Create推荐系统。

相关内容