我使用Elasticsearch来处理10T,所以我做了关于要使用多少碎片、RAM、CPU和硬盘的所有工作,但当我试图配置这些节点时,我对要处理的功能数量以及我们为什么必须使用它感到非常困惑,因此,如果有一些关于如何在这个主题上进行标准配置和最佳实践的指导方针或建议,如果我需要配置其他节点
这在很大程度上取决于您的用例:它是索引还是重搜索,文档模式是什么,您将运行什么搜索查询。例如,n-gram代币可能很容易将所需资源膨胀10倍。
不过,几乎没有什么通用规则。
- 您希望您的碎片大小在20-50 GB之间
- 您希望集群中的碎片少于2万个
- 您希望碎片在机器之间均匀分布
- 您想要大约30 GB的堆
- 您希望您的堆占用大约50%的RAM
- 你需要尽可能多的CPU
- 您想要本地(非网络连接(SSD
或者,如果你想尽可能减少麻烦,你可以选择弹性云,这将消除一些硬件问题,以换取费用。