我们正在考虑使用Websolr插件在Rails应用程序中搜索资源。
该应用程序包含许多资源模型。大多数资源模型都是自包含的,有一系列属性:作者、标题、一组标签等,但有些资源模型附带了pdf。我们需要索引这个pdf的内容,这样它就可以作为资源的一部分进行搜索。
我应该如何处理?
这应该让你开始:ExtractingRequestHandler,它将Tika集成到Solr中。
我们正在考虑使用Websolr插件在Rails应用程序中搜索资源。
该应用程序包含许多资源模型。大多数资源模型都是自包含的,有一系列属性:作者、标题、一组标签等,但有些资源模型附带了pdf。我们需要索引这个pdf的内容,这样它就可以作为资源的一部分进行搜索。
我应该如何处理?
这应该让你开始:ExtractingRequestHandler,它将Tika集成到Solr中。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium