如何防止搜索引擎索引文本范围



从我目前能够找到的信息来看,<noindex>应该实现这一目标,使页面的单个部分对搜索引擎蜘蛛隐藏起来。但是,许多浏览器似乎也不遵守这一点 - 所以如果是这种情况,应该使用什么标记来代替/除此之外?

  • 雅虎使用内置类:<span class="robots-nocontent">
  • Googlebot 没有等效的(?)
  • Yandex使用<noindex>
  • 别人?

没有办法阻止爬虫索引任何内容,由它们的作者决定爬虫会做什么。遵守规则的人,如雅虎Slurp,Googlebot等,他们每个人都有自己的规则,正如你已经发现的那样,但是否完全遵守规则仍然取决于他们 - 假设你设置了robots-nocontent但该部分仍然被索引并放在其他地方,也许是为了检查垃圾邮件,非法材料, 恶意软件等

这只是为了"好"的人,不知道坏人会做什么。因此,将所有noindex的东西都视为一套准则,而不是一套严格的规则。

唯一可以肯定的是:如果您有敏感数据,或者您根本不想要索引某些内容 - 不要将其公开。

最新更新