我想在我的 Ubuntu 上安装 Hive.我读了这篇文章,这对我有很大帮助。我完成了除步骤 4 之外的所有步骤。我不明白此步骤中应该做什么。
你能详细解释一下这一步吗?
第 1 步:下载并提取 Hadoop
第 2 步:将JAVA_HOME路径设置为 conf/hadoop-env.sh//此步骤是为 hadoop 设置 java 路径
第 3 步:conf/core-site.xml:
<configuration>
<property>
<name>fs.default.name</name> //Place your home folder here for using hadoop
<value>hdfs://localhost:9000</value>
</property>
</configuration>
第 4 步:conf/hdfs-site.xml:
<configuration> //This setting for the number of replications of the file or you can add data node for the save the file
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
第 5 步:conf/mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value> // add your master host in the place of localhost here
</property>
</configuration>
步骤 6:登录 SSH 本地主机并格式化新的分布式文件系统
bin/hadoop namenode -format
第 7 步:启动 hadoop 守护进程:
bin/start-all.sh
第 8 步:检查端口下方的 NameNode & JobTracker
http://localhost:50070/ //master
http://localhost:50030/ //slave
最好尝试使用 ssh 检查您的工作节点
步骤9:下载并提取Hive
第 10 步:设置以下环境变量。
export HADOOP_HOME=<hadoop-install-dir>
export HIVE_HOME=<hive-install-dir>
export PATH=$HIVE_HOME/bin:$PATH
$HIVE_HOME/bin/hive
步骤 #3 是否顺利进行?在步骤3之前,您将二进制文件从SVN下载到您的计算机,步骤4是使用Hadoop环境设置二进制文件。
步骤 4 建议如下:
export PATH=$PATH:/usr/src/hive/build/dist/bin/
-> 表示您要在 PATH 环境中添加目录/usr/src/hive/build/dist/bin/。您必须在此文件夹中安装了 Hive->/usr/src/hive/build/dist/bin/因此在您的路径中添加此文件夹(实际上是 Hive 二进制文件)将允许您在机器中运行 Hive。
export PATH=$PATH:/usr/src/hive/build/dist/lib/
-> 表示您要在 PATH 环境中添加目录/usr/src/hive/build/dist/lib/。在计算机上安装 Hive 后,Hive 相关库位于此文件夹中>/usr/src/hive/build/dist/lib/中,因此将此目录添加到 PATH 将有助于 Hive 成功运行。
export PATH=$PATH:/usr/local/hadoop/bin
-> 如果你已经在机器中运行了Hadoop,这应该已经设置好了,否则这个命令只是在你的机器路径中设置Hadoop二进制文件夹。
如果您不知道什么是PATH,只需在互联网上查找"Linux中的PATH"。
这个PPA使得在Ubuntu上安装Hive变得非常容易。