错误螺母 'http.agent.name'中未列出任何代理



我正在使用nutch2.2.1。日志文件正在生成以下错误

错误协议。RobotRulesParser - 我们宣传的代理(nutch-spider-2.2.1)未在"http.robots.agents"属性中列在第一位!

我的坚果网站.xml是(对于上述财产)

<property>
<name>http.agent.name</name>
<value>nutch-spider-2.2.1</value>
</property>

我的坚果默认值.xml是

<property>
<name>http.agent.name</name>
<value></value>
</property>

实际问题在哪里?请清楚地引导它(正确解释)。这个问题发布在这里,但我必须赏金这个问题(如果需要),这就是为什么再次发布它。

你 shoule 添加 "http.robots.agents" 的属性,并将 http.agent.name 的值作为第一个代理名称,并将默认的 * 保留在列表的末尾。

<property>
     <name>http.robots.agents</name>
     <value>nutch-spider-2.2.1,*</value>
</property>

相关内容

最新更新