我的wordpress机器人.txt文件中有以下设置。由于某种原因,允许部分不起作用?根据谷歌网站管理员工具,它不喜欢以下内容。
谁能告诉我为什么?
Disallow: /blog/author/*
Allow: /blog/author/admin
谢谢! :)
尾随*
是不必要的。机器人.txt约定是Disallow
表达式将阻止任何以表达式开头的 URL。最初的机器人.txt规范没有通配符。使用通配符,/blog/author/
和/blog/author/*
的含义相同。
最初的robots.txt规范说,机器人将读取robots.txt文件并应用第一个匹配规则。尽管最初的规范不包括Allow
指令,但早期的实现者继续使用"第一个匹配规则"规则。如果Googlebot正在使用它,那么它会看到disallow行,并假设它无法抓取/blog/author/admin,因为它匹配。
我建议将Allow
移到Disallow
上方,并从Disallow
表达式中删除星号。
我认为你在WordPress机器人中尝试做的事情.txt与你在这种情况下看到的相同 webbingbcn.es/robots.txt 但允许/wp-admin/。
- 允许:/wp-admin/
- 禁止:/作者/