我正在使用crawler4j
抓取rotentomatoes网站以提取结构化数据。我已经设置了所有的东西,在项目主页上的示例中给出了默认的URL,一切都正常,但当我放入自己的种子时,应用程序只访问我给定的URL。我错过了什么吗?
最常见的错误是shouldVisit方法总是返回false,因此爬网程序只访问种子URL。