如何决定使用什么模型?
你是对的 - 这不是回归问题,除非你的每个酒店标签背后都有一些线性逻辑(例如,65号酒店在65英里外,而66号酒店在66英里外)。情况似乎并非如此,但如果是这样,那么这是一个简单的回归问题,你基本上可以预测一个人能走多远。但是,我退缩了。
正如您所指出的,您真正应该研究的是多类分类。
如果您有scikit-learn的经验,执行这种类型的分析应该不难; 查看OneVsRestClassifier
。甚至还有一个关于如何使用该特定类的很棒的教程。
推荐系统
尝试预测用户接下来会购买什么"产品"。