我已经开始阅读hadoop。我也想学习实践。由于hadoop是分布式环境,并且是在linux上运行的,所以我不能在我的本地机器上运行windows。互联网上是否有云或虚拟机可供我自己设置整个环境并开始学习?这也很好,我可以得到预配置的hadoop集群,但我更喜欢自己配置。
Cloudera (cloudera.com)有一些预配置的单节点环境。它只有3GB,但你可以找到你需要的每个BigData组件。
http://www.cloudera.com/downloads/quickstart_vms.htmlOracle也有一个虚拟机,免费用于开发和测试:Oracle BigData Lite
http://www.oracle.com/technetwork/database/bigdata - appliance/oracle bigdatalite - 2104726. - html
和Hortonworks也有一个预配置的沙箱。
我更喜欢Cloudera环境。如果您希望测试Sqoop组件,Oracle是不错的选择。
既然您正在寻找一个基于云的环境来玩,我建议使用Cloudera Live演示,这实际上是Hue演示。它基本上是一个真实的Hue实例(它是非管理员用户将使用和看到的UI),位于一个向公众开放的真实集群前面。您可以浏览文件系统,发出查询等。
如果你想探索更多的表面细节,是的,你应该运行你自己的玩具集群。如果您喜欢Cloudera发行版,请注意,Cloudera Manager是免费的,它也是一个安装程序,可以为您在云中启动集群,就像在Amazon EC2上一样。
我也想学习一些关于Hadoop的知识,所以我买了一个树莓派,按照这些说明安装了Raspbian wheezy和Hadoop。
它很好地解释了如何设置一个单节点集群。树莓派上的Hadoop不是很快,但在我看来,它足够快,可以学习Hadoop的基础知识。
如果您想在本地机器上设置一个单节点集群,我更愿意使用发行版,正如user3341955已经提到的那样。我选择了Hortonworks,因为在Mac OS x上有一个非常简单的Virtualbox设置指南。
和VMware Player在Windows上的安装指南:
祝你使用Hadoop愉快!)