Crawler4j只访问种子URL



我正在使用crawler4j抓取rotentomatoes网站以提取结构化数据。我已经设置了所有的东西,在项目主页上的示例中给出了默认的URL,一切都正常,但当我放入自己的种子时,应用程序只访问我给定的URL。我错过了什么吗?

最常见的错误是shouldVisit方法总是返回false,因此爬网程序只访问种子URL。

相关内容

  • 没有找到相关文章

最新更新