如何在EMR上安装cloudera impala



我可以安装唯一没有cloudera管理器和没有cdh的impala吗?我将使用apache版本的hadoop?

是的,这绝对是可能的。将存储库添加到sources.list文件中,然后更新存储库。

deb[拱= amd64]http://archive.cloudera.com/impala/ubuntu/precise/amd64/impala精确-impala1贡献债务-srchttp://archive.cloudera.com/impala/ubuntu/precise/amd64/impalaprecise-impala1 contrib

之后,仅仅是:

sudo apt-get install impala                (Binaries for daemons)
sudo apt-get install impala-server         (Service start/stop script)
sudo apt-get install impala-state-store    (Service start/stop script)

但是不要忘记满足所有的先决条件。有关详细信息,请访问

您可以在这里查看如何在Amazon EMR中安装和使用Impala的详细说明:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-impala.html

EMR基于运行在Debian squeeze之上的Amazon Hadoop发行版。所以,是的,使用Cloudera的DEB库是可能的。

您需要SSH到您的EMR主节点,在EMR控制台中找到地址。

如果您打算使用外部世界的JDBC/ODBC客户端连接到Impala,您还需要在您分配给EMR集群的安全组上启用安全规则。

最新更新