我想在家里的商品电脑上试用H2O。如何将它们加入集群?
我需要先创建Hadoop集群吗?
我在哪里可以找到对我有帮助的文档?
基本上,您需要创建一个平面文件,这是一个简单的文本文件,列出集群中每个节点的IP地址和端口。你可以给集群一个名称,我喜欢用相同的名称命名平面文件,它将是"lantest.txt".
然后,您需要在每台机器上获取h2o.jar,并将您的平面文件放在同一目录中(同样,在每台计算机上)。然后在每台机器上启动:
java -Xmx2G -ea -jar h2o.jar -name lantest -ip 192.168.x.y -port 54321 -flatfile lantest.txt
保持控制台窗口打开,因为日志消息会被写入其中
通常,您会为每台机器更改.x.y
,但其他一切都保持不变。-Xmx2G
说我给每台机器2GB;您可能想要调整它(但对于每个节点,它必须完全相同。)
另一个必须完全相同的是h2o.jar的版本:一个小的版本差异是不够的,因为它检查md5校验和!
你可能会遇到的另一件事是防火墙。每个节点必须能够在端口54321和54322上看到彼此的节点。所以打开每台机器上防火墙上的端口。(在Windows上,我还必须打开Java访问权限。)