小贝子编程

使用Apache Lucene进行搜索优化

本文关键字：搜索优化 Apache Lucene 使用 java hadoop lucene cloudera
更新时间 : 2023-08-27
英文 : Search optimization using Apache Lucene

我正在进行一个项目，使用ApacheLucene在twitter数据上实现大规模索引以优化搜索。Lucene提供反向索引以过滤出符合指定选择标准的块。

要实现这个项目，我应该如何进行？我应该安装Cloudera vm并继续吗？或者我应该在Ubuntu平台上从Apache部署Hadoop吗？

我之所以这么问，是因为我无法确认Cloudera是否已经使用Lucene来优化搜索。

请告知。

Cloudera为您提供用于自动安装和集群管理的debian包和软件。就是这样。Hadoop堆栈中没有任何关于搜索（以及优化）的内容。所以你可以为你的项目选择香草或cloudera。

对于搜索，您可以使用Elasticsearch。它与hadoop集成，并在内部使用Lucene

最新更新

如何下载完整的雅典娜查询结果到CSV文件
pyspark:在执行join - restrict相同列名选择时设置别名
如何在Eclipse RCP中隐藏/删除Preferences对话框中的导入/导出按钮
在自定义jackson反序列化器中以响应式方式从db加载实体
使用RestSharp从API返回JSON数据
OAuth同意屏幕不显示正确的AppName
使用ByRef更新记录集字段
提取多个XML文件中所有标签之间的文本，并将提取的文本复制到csv文件中
在Laravel和Vue之间共享数据的糟糕方式
可以在Azure Devops中找到需求文本文件
如何在tensorflow keras中引用ground truth变量?
Json解析并分配给DTO
如何通过不重复结果来正确地循环一个范围
给出零最优值的AMPL程序
再次出现身份验证问题，GCP源存储库使用publickey
打印添加到数据库的记录数有问题
如何插入一行到一个表在sql是完全相同的另一个表，但只有一个列不同?
如何在jupyter notebook中导入两个或多个包?
对product类型的访问器进行泛型迭代
如何在 react 中"remember"昂贵的递归函数中先前计算的值？
在eclipse IDE上使用Tomcat服务器在本地机器上修复eclipse上的编译错误，我能做些什么?
在使用reactjs和Material UI上传组件向API发送图像/文件时遇到麻烦
Firebase 事务方法是否与所有写入操作(包括云函数的写入操作)兼容？
违反了竞争条件和主键约束
使用REGEX捕获SGM标记之间的文本
为什么我无法分配所有填充值？
如何以编程方式将"LINK/URL"复制到 android 应用程序中的剪贴板？
用sql验证hive中的数据类型decimal(5.2)
如何在Redux状态更新时更新功能组件?
使用jsonata的日期范围

使用Apache Lucene进行搜索优化

相关内容

最新更新

热门标签：