小贝子编程

Crawler4j只访问种子URL

我正在使用crawler4j抓取rotentomatoes网站以提取结构化数据。我已经设置了所有的东西，在项目主页上的示例中给出了默认的URL，一切都正常，但当我放入自己的种子时，应用程序只访问我给定的URL。我错过了什么吗？

最常见的错误是shouldVisit方法总是返回false，因此爬网程序只访问种子URL。

最新更新