使用Apache Solr对Nutch数据进行索引



我正在尝试设置Solr以索引Nutch爬网程序的结果。我在网上找到的教程要求将conf/schema.xml文件从Nutch复制到Solr中,作为配置的一部分,但在我的Nutch版本中不存在该文件。有没有其他方法可以做到这一点,或者我遗漏了什么?欢呼

请参阅"官方"Nutch教程:

注意:由于NUTCH-2745,schema.xml不包含在二进制包中。请从源存储库下载schema.xml。

NUTCH-2745仅适用于NUTCH 1.16版本,并将在1.17中修复。

最新更新