我熟悉Hadoop组件,如hive,hbase,hdfs等。但我对Apache Kudu很陌生。
到目前为止,从我的研究中,我了解到 kudu 只不过是像镶木地板一样的柱状存储。此外,它比Hbase更快。
但是我仍然无法找到任何有效的kudu安装文档。甚至我想知道我是否真的需要为 kudu 或其内置的 hadoop(EMR 或 Dataproc(安装任何单独的软件包。
请帮助我如何开始动手使用捻角羚。
Kudu不是一种文件格式,而是一种不同的存储引擎。将其视为HDFS(或S3(的并行/替代文件系统。是的,它确实需要安装主服务器和平板电脑服务器,请参阅 Apache 网站上的体系结构概述。
由于它是一个开源的Apache项目,安装说明也可以在Apache网站上找到:https://kudu.apache.org/docs/installation.html。