我有一个数据集,其中包含客户的访问历史。
它在数据集中有三列,包括客户ID、AM/PM(上午或下午访问)和工作日/周末(工作日或周末访问)。
我想从这个数据集中学习,并选择在指定输入(如AM/工作日)中访问机会最大的前50名客户。
目前,我使用一类SVM为每个客户创建模型(我只有阳性(访问)数据)。由于一类SVM只有二进制输出,我只能告诉特定的客户是否会访问指定的输入,而不是选择前50名客户。
我想知道是否有一种算法可以从仅为正的数据集中学习,并给出分数或类似概率的输出?
这是机器学习中的一个子类别问题。阅读这项调查,你可以学到很多:"一类分类:研究和评论的分类技术"(http://arxiv.org/pdf/1312.0049.pdf)。希望能有所帮助。