从我目前能够找到的信息来看,<noindex>
应该实现这一目标,使页面的单个部分对搜索引擎蜘蛛隐藏起来。但是,许多浏览器似乎也不遵守这一点 - 所以如果是这种情况,应该使用什么标记来代替/除此之外?
- 雅虎使用内置类:
<span class="robots-nocontent">
- Googlebot 没有等效的(?)
- Yandex使用
<noindex>
- 别人?
没有办法阻止爬虫索引任何内容,由它们的作者决定爬虫会做什么。遵守规则的人,如雅虎Slurp,Googlebot等,他们每个人都有自己的规则,正如你已经发现的那样,但是否完全遵守规则仍然取决于他们 - 假设你设置了robots-nocontent
但该部分仍然被索引并放在其他地方,也许是为了检查垃圾邮件,非法材料, 恶意软件等
这只是为了"好"的人,不知道坏人会做什么。因此,将所有noindex的东西都视为一套准则,而不是一套严格的规则。
唯一可以肯定的是:如果您有敏感数据,或者您根本不想要索引某些内容 - 不要将其公开。