我一直在尝试围绕个性化页面排名算法及其工作原理来包装我的头。我偶然看到这篇论文给出了这个图表:见链接到下面的图片与PPR计算的权重。我很难用他们给出的模型再现这些计算。
有谁能帮我解释一下这个概念吗?谢谢!
这篇论文是个性化页面排名的一个很好的参考。基本上我的理解是,ppr分数告诉你从源节点移动到目标节点的概率。它是描述图中特定源节点和目标节点之间关系的特定分数。
如果您在重现结果时遇到问题,您可以在python中使用networkx,加载一个图形并使用networkx。pagerank(图表、个性化= {a: 0,"s":1,b: 0…})Networkx使用幂次迭代方法来计算ppr,您可以得到如示例所示的精确结果。
本论文的作者在这里有c++代码https://github.com/snap-stanford/snap/blob/master/snap-core/randwalk.h由于该方法是基于随机游走的方法,因此您无法获得与示例中所示完全相同的结果,但排名是正确的。
希望对你有帮助。