在布林/佩奇1998年的论文中,这句话是什么意思?



我不确定这是否属于So,但我不知道其他SE网站更合适。

在Brin和Page的论文中,"大规模超文本Web搜索引擎的解剖结构",它们描述了Pagerank算法中的变量D d 是随机冲浪者请求新随机页面的概率。在下一行,他们说:

一个重要的变化是仅添加阻尼因子D 单页或一组页。这允许个性化和 可能使故意误导该系统的几乎不可能 为了获得更高的排名。

这是什么意思?他们为什么要将阻尼因子添加到一个页面?

这是否意味着随机冲浪者将继续遵循链接,直到它们到达特定页面?我认为这是没有道理的,因为随机冲浪者可以陷入循环,而永远不会到达该特定页面。

wikipedia关于Pagerank的文章解释了阻尼因素的整体概念,但是该论坛帖子更好地解释了它。

最终,任何网络冲浪者最终都将达到他/她感到无聊并做其他事情的地步。理论(假设我正确理解了Wikipedia文章(是,在查看给定页面时,用户有可能单击一个指向另一页的链接之一的机会有85%。因此,连续查看两页的几率为85%,查看三页的几率为72.25%,查看四页的几率为61.4%,等等。

因此,如果您有页面链接到页面B,则B链接到页面C:

a-> b-> c

然后,第A页的受欢迎程度有85%的机会引起B流行,但只有72.25%的机会使Page C流行,因为用户有15%的机会随机进入其他网站。在这些决策点中的每一个。

没有那次损失,我认为世界上每个网站最终都会以无限的页面排名,因为页面排名将在每个页面中传播到其他每个页面,例如潮汐浪潮。通过抑制每个步骤的页面等级强度的进步,您可以确保从高级站点链接的站点可以提高等级,但不能通过一百个啤酒花到达。

您所引用的位在其后续论文中得到了更多的解释,在这些论文中,他们解释说,他们通常在计算页面排名时使用恒定的阻尼因子,并假设有15%(1-。85(跳到世界上任何任意页面>的概率,所有可能的页面都可以平等地获得这些跳跃,但是您可以使用固定的目标页面(甚至是单个网页(进行接收所有这些随机跳跃。当您这样做时,您最终会根据与该特定页面或一组页的近距离计算非常不同的页面排名。

例如,如果用户将特定的页面设置为他/她的浏览器开始页面,则可以假设用户会单击"主"按钮并在无聊时返回该页面。因此,从该页面密切链接的页面将为该用户具有更高的个人页面排名。您可以通过添加诸如用户书签,经常访问的页面等内容来创建一个更好的个性化排名,并且因为基于有限的"重新启动页面"的排名是通过这种方式个性化的,因此无法轻松地通过商业操纵它们兴趣,因为没有人可能会从您的书签(或主页或其他内容(中的五个特定页面之一购买链接。

相关内容

  • 没有找到相关文章

最新更新