在机器学习中,按点排序和按对排序有什么区别



我一直在阅读关于成对排名的论文,但这是我没有得到的:

逐点排名和成对排名之间的训练/测试数据有什么区别?这是我一直在读的论文:http://www.cs.cornell.edu/people/tj/publications/joachims_02c.pdf

在那里,它说配对排名中的数据点是两个链接之间的不平等:

[line].=。[两个链路之间的不等式,这是目标]qid:[qid][[链路1和2的特征]:[值1和2]]#[info]

然而,RankLib确实支持像RankNet和RankBoost这样的成对排序器,但它使用的数据点格式是逐点的格式

[line].=。[绝对排名,哪个是目标]qid:[qid][feature1]:[value1][feature2]:[value2]…#[info]

我有什么东西不见了吗?

逐点排序类似于回归。每个点都有一个相关的等级分数,您希望预测该等级分数。因此,在给定查询的情况下,您标记的数据集将有一个特征向量和相关的秩分数

IE:{d1,r1}{d2,r2}{d3,r3}{d4,r4}

其中r1>r2>r3>r4

成对排序类似于分类。每个数据点都与另一个数据点相关联,目标是学习一个分类器,该分类器将预测两者中哪一个与给定查询"更相关"。

IE:{d1>d2}{d2>d3}{d3>d4}

最新更新