我想编写一个程序,该程序将为用户找到新音乐,只有用户的计算机中的音乐。
对于用户计算机上的每位艺术家,我将创建带有歌曲中的单词的新列表。(当然删除停止字)
例如:{'plotbo':{'secret':11,'Unicorn':8,'Helmet':6}}和其他单词
然后,我想使用DICTVECTORIZER将我的列表转换为numpy阵列或scipy.sparse矩阵,供Scikit-Learn估计器。
例如,上面将是-array([[11.,8。,6。])
所以,对于用户计算机上的每个艺术家,我都有列表。
此外,我有1000名艺术家的数据库,对于每位艺术家,我也都有这种类型的列表。
现在,我不知道找到与用户所拥有的艺术家的最佳方法是什么。
也许Scikit-Learn中有一些内置功能?
Scikit-Learn中没有内置的推荐系统。但是,您可以使用最近的邻居分类器。查看GraphLab.Create推荐系统。