在 Ubuntu 上安装 Hive



我想在我的 Ubuntu 上安装 Hive.我读了这篇文章,这对我有很大帮助。我完成了除步骤 4 之外的所有步骤。我不明白此步骤中应该做什么。

你能详细解释一下这一步吗?

第 1 步:下载并提取 Hadoop

第 2 步:将JAVA_HOME路径设置为 conf/hadoop-env.sh//此步骤是为 hadoop 设置 java 路径

第 3 步:conf/core-site.xml:

<configuration>
  <property>
    <name>fs.default.name</name>  //Place your home folder here for using hadoop 
    <value>hdfs://localhost:9000</value>
  </property>
</configuration>

第 4 步:conf/hdfs-site.xml:

<configuration>          //This setting for the number of replications of the file or you can add data node for the save the file
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
</configuration>

第 5 步:conf/mapred-site.xml:

<configuration>
  <property>
    <name>mapred.job.tracker</name>
    <value>localhost:9001</value>        // add your master host in the place of localhost here
  </property>
</configuration>

步骤 6:登录 SSH 本地主机并格式化新的分布式文件系统

bin/hadoop namenode -format

第 7 步:启动 hadoop 守护进程:

bin/start-all.sh

第 8 步:检查端口下方的 NameNode & JobTracker

http://localhost:50070/       //master
http://localhost:50030/       //slave  

最好尝试使用 ssh 检查您的工作节点

步骤9:下载并提取Hive

第 10 步:设置以下环境变量。

export HADOOP_HOME=<hadoop-install-dir>
export HIVE_HOME=<hive-install-dir>
export PATH=$HIVE_HOME/bin:$PATH
$HIVE_HOME/bin/hive

步骤 #3 是否顺利进行?在步骤3之前,您将二进制文件从SVN下载到您的计算机,步骤4是使用Hadoop环境设置二进制文件。

步骤 4 建议如下:

export PATH=$PATH:/usr/src/hive/build/dist/bin/

-> 表示您要在 PATH 环境中添加目录/usr/src/hive/build/dist/bin/。您必须在此文件夹中安装了 Hive->/usr/src/hive/build/dist/bin/因此在您的路径中添加此文件夹(实际上是 Hive 二进制文件)将允许您在机器中运行 Hive。

export PATH=$PATH:/usr/src/hive/build/dist/lib/

-> 表示您要在 PATH 环境中添加目录/usr/src/hive/build/dist/lib/。在计算机上安装 Hive 后,Hive 相关库位于此文件夹中>/usr/src/hive/build/dist/lib/中,因此将此目录添加到 PATH 将有助于 Hive 成功运行。

export PATH=$PATH:/usr/local/hadoop/bin

-> 如果你已经在机器中运行了Hadoop,这应该已经设置好了,否则这个命令只是在你的机器路径中设置Hadoop二进制文件夹。

如果您不知道什么是PATH,只需在互联网上查找"Linux中的PATH"。

这个PPA使得在Ubuntu上安装Hive变得非常容易。

最新更新