Pagerank和垃圾邮件



假设我们有一个具有4个连接的页面/节点的图。我们还计算了这个图的pagerank,现在我们想上传一个新的页面/节点,以增加其pagerank。我想知道,如果我们还上传N个页面/节点作为我们想要增加页面排名的页面的枢纽,我们会实现我们的目标吗?(第一个图和垃圾邮件图没有连接)

有几种方法可以利用谷歌1998年专利申请中公布的谷歌页面排名。正如您所指出的,您添加到网站的每个页面都会添加到网站上可用的总页面排名中。

甚至还有一种方法可以创建一个具有无限pagerank的页面:创建一个页面链,每个页面链接到下一个页面。让链中的每一页都链接回第一页。你制作这个链的时间越长,第一页的页面排名就越多。

这些算法弱点在现实世界中很难利用。

首先,谷歌对其专利申请中最初公布的算法进行了修改。他们的一些更新是为了弥补这样的弱点。他们还没有公布他们目前的算法或他们所做的更改列表。

其次,谷歌只会抓取超过某个页面等级阈值的页面。这意味着谷歌机器人甚至不会抓取大量为制造pagerank而创建的额外页面。如果谷歌机器人不抓取它们,它们就不会被用于页面排名计算。

第三,谷歌积极惩罚它检测到的试图向其算法发送垃圾邮件的网站。这可能包括阻止网站上的页面通过任何页面排名。谷歌现在非常擅长检测生成的没有内容或有胡言乱语的页面。创建具有真实内容的有用页面以将其放入这样的方案中是比其价值更大的努力。

相关内容

  • 没有找到相关文章

最新更新