Solr为PDF文档编制索引并将其发布到远程服务器



嗨,说到Solr,我是一个天真的用户。请指导我克服以下障碍。

1) Solr索引PDF文档

尝试过的解决方案

我使用tika应用程序0.9.jar将输入PDF文件中的内容提取为文本文件。现在我正试图编写一个java代码,将文档索引到Solr。

2) 将它们发布到远程服务器

我需要将文档或索引发布到中央远程服务器。curl命令可以用于此吗。

问候巴拉吉。

1)Solr索引PDF文档-我相信Solr可以为您做到这一点。您可以使用Solr的http接口或SolrJ。2) 将索引发布到远程服务器-Solr复制可能符合要求。

假设PDF在web服务器上,您可以使用Nutch来获取和解析它们,然后通过其HTTP接口将索引推送到Solr。

相关内容

  • 没有找到相关文章

最新更新