Hadoop基准测试- terasort

我为Hadoop构建了自己的4个节点(namenode + 3xdatanode)集群。
现在-我试着测试它的性能:

花了我71秒:
hadoop jar $HADOOP_INSTALL/hadoop-examples.jar randomwriter随机数据测试。bytes_per_map = 5000000 -Dtest.randomwrite.total_bytes = 5000000

花了我218秒:
hadoop jar $HADOOP_INSTALL/hadoop-examples.jar sort random-data sorted-data

花了我368秒
hadoop jar $HADOOP_INSTALL/hadoop-test.jar testmapredsort -sortInput随机数据-sortOutput排序数据

我如何知道我的集群配置是否良好?我的群集节点配置需要多少时间:
4 × intel (R) Xeon(R) CPU E5645 @ 2.40GHz(每个6核)
24gb内存

谢谢。

我在我的集群(1个namenode + 2个datanode运行Hadoop-0.21.0)上快速运行了您的程序。最后分别用了27秒、23秒和26秒。

使用4xIntel(R) Xeon(R) CPU E5607 @ 2.27GHz(每个4核)进行测试31日gb RAM

我让hadoop配置保持原样，但关闭了投机任务:mapred.map.tasks.speculative。执行，mapred.reduce.tasks.speculative.execution -> false

您还可以使用不同的块大小设置(dfs.block)。大小，最好大于默认值128)。看看这会不会加快速度。

hadoop基准测试的更多信息:http://www.michael-noll.com/blog/2011/04/09/benchmarking-and-stress-testing-an-hadoop-cluster-with-terasort-testdfsio-nnbench-mrbench/

相关内容

最新更新

热门标签：