在 Ubuntu 上安装 Hive

我想在我的 Ubuntu 上安装 Hive.我读了这篇文章，这对我有很大帮助。我完成了除步骤 4 之外的所有步骤。我不明白此步骤中应该做什么。

你能详细解释一下这一步吗？

第 1 步：下载并提取 Hadoop

第 2 步：将JAVA_HOME路径设置为 conf/hadoop-env.sh//此步骤是为 hadoop 设置 java 路径

第 3 步：conf/core-site.xml：

<configuration>
  <property>
    <name>fs.default.name</name>  //Place your home folder here for using hadoop 
    <value>hdfs://localhost:9000</value>
  </property>
</configuration>

第 4 步：conf/hdfs-site.xml：

<configuration>          //This setting for the number of replications of the file or you can add data node for the save the file
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
</configuration>

第 5 步：conf/mapred-site.xml：

<configuration>
  <property>
    <name>mapred.job.tracker</name>
    <value>localhost:9001</value>        // add your master host in the place of localhost here
  </property>
</configuration>

步骤 6：登录 SSH 本地主机并格式化新的分布式文件系统

bin/hadoop namenode -format

第 7 步：启动 hadoop 守护进程：

bin/start-all.sh

第 8 步：检查端口下方的 NameNode & JobTracker

http://localhost:50070/       //master
http://localhost:50030/       //slave

最好尝试使用 ssh 检查您的工作节点

步骤9：下载并提取Hive

第 10 步：设置以下环境变量。

export HADOOP_HOME=<hadoop-install-dir>
export HIVE_HOME=<hive-install-dir>
export PATH=$HIVE_HOME/bin:$PATH
$HIVE_HOME/bin/hive

步骤 #3 是否顺利进行？在步骤3之前，您将二进制文件从SVN下载到您的计算机，步骤4是使用Hadoop环境设置二进制文件。

步骤 4 建议如下：

export PATH=$PATH：/usr/src/hive/build/dist/bin/

-> 表示您要在 PATH 环境中添加目录/usr/src/hive/build/dist/bin/。您必须在此文件夹中安装了 Hive->/usr/src/hive/build/dist/bin/因此在您的路径中添加此文件夹（实际上是 Hive 二进制文件）将允许您在机器中运行 Hive。

export PATH=$PATH：/usr/src/hive/build/dist/lib/

-> 表示您要在 PATH 环境中添加目录/usr/src/hive/build/dist/lib/。在计算机上安装 Hive 后，Hive 相关库位于此文件夹中>/usr/src/hive/build/dist/lib/中，因此将此目录添加到 PATH 将有助于 Hive 成功运行。

export PATH=$PATH：/usr/local/hadoop/bin

-> 如果你已经在机器中运行了Hadoop，这应该已经设置好了，否则这个命令只是在你的机器路径中设置Hadoop二进制文件夹。

如果您不知道什么是PATH，只需在互联网上查找"Linux中的PATH"。

这个PPA使得在Ubuntu上安装Hive变得非常容易。

相关内容

最新更新

热门标签：