嗨,说到Solr,我是一个天真的用户。请指导我克服以下障碍。
1) Solr索引PDF文档
尝试过的解决方案
我使用tika应用程序0.9.jar将输入PDF文件中的内容提取为文本文件。现在我正试图编写一个java代码,将文档索引到Solr。
2) 将它们发布到远程服务器
我需要将文档或索引发布到中央远程服务器。curl命令可以用于此吗。
问候巴拉吉。
1)Solr索引PDF文档-我相信Solr可以为您做到这一点。您可以使用Solr的http接口或SolrJ。2) 将索引发布到远程服务器-Solr复制可能符合要求。
假设PDF在web服务器上,您可以使用Nutch来获取和解析它们,然后通过其HTTP接口将索引推送到Solr。