Spacy-实体链接器-为什么预测分数是prob和余弦sim的组合



我在spacy下对实体链接器管道进行了预测方法,由于某种原因,分数定义如下:

scores = prior_probs + sims - (prior_probs*sims)

此处链接

有人有这个经验/知道这个公式是从哪里来的吗?

谢谢!

它取自"通过类型、描述和上下文的联合编码进行实体链接"第4节等式2。

尽管在详细解释这个公式时,我觉得不够自信,但总的来说,目的是将来自外部基于知识的资源(论文中的KB(的实体候选者的概率分数(即先验概率(和用句子编码器估计的分数(用于对提述链接及其上下文进行编码(相结合,sims,因为它们计算编码提及向量和所有候选实体之间的余弦相似性(这就是为什么只有当"incl_text"为true时才使用该公式(。

最新更新