我正在构建一个图书推荐系统。数据集中的列是:
userid, location, age, Book Title, Author, Year of publication, Rating
对于这个我认为属性为
location, age, year of publication
输出应该是书名和作者那么我该如何创建
类呢?如何对图书和作者的标题进行分类?最好的算法是什么?请同时提供纸质链接
提前感谢
阅读Toby Segaran所著的Programming Collective Intelligence关于如何实现推荐系统的章节。
netflix大奖解决方案描述是解决协同过滤问题的一个很好的起点:
http://www2.research.att.com/volinsky/netflix Bellkor2008.pdf
有一个关于研究论文推荐系统的有趣的演示,它可能是你正在寻找的。它基于Python的NumPy库,并且该方法看起来非常可靠。
http://software-carpentry.org/v4/matrix/recommend.html