大多数教程都涉及下载一个虚拟机来使用Hadoop。是否有一种方法可以从头开始创建Hadoop项目,或者使用IntelliJ导入现有项目?
另外,我正在Windows 10上工作,并且添加环境变量HADOOP_HOME
和JAVA_HOME
似乎不起作用。
这是我得到的错误:
Error: JAVA_HOME is incorrectly set. Please update C:Hadoophadoop-2.7.2confhadoop-env.cmd
但是,我的JAVA_HOME
是设置正确。
Hadoop的全部意义在于你有一个运行MapReduce任务的节点集群。MapReduce作业是简单的Java程序,您可以在任何IDE(如IntelliJ)中创建。然后可以在您的集群上运行此代码。如果您没有集群,那么您需要创建一个集群,这是您下载虚拟机的时候。
然而,如果你只在你的计算机上运行它,那么你没有必要使用MapReduce,因为你的集群将是虚拟的,所以你不会获得任何性能改进。听起来你对Hadoop是什么有误解。多研究一下,你就会明白为什么你正在努力做的事情不起作用。