看着蛇咬,这是一个很棒的python软件包,用于运行hadoop fs
命令集
我需要从Python内运行hadoop dfsadmin
命令集。需要运行hadoop dfsadmin -report
和hadoop dfsadmin -refreshNodes
等命令的写作工具
那么,对于所有令人敬畏的Python开发人员,在Hadoop操作任务上编写工具,运行这些命令的推荐方法是什么?
炮击非常昂贵,还有其他建议的方法/建议吗?
您可能可以使用HDFS节俭库。我不确定库有多完整,但这里有一些链接。最好的选择是为Python引用Clouderas Hue库。我确实看到了重新研究的功能。
hdfs thrift页面http://wiki.apache.org/hadoop/hdfs-apis
chloudera hue library for HDFS-这些库是由thrift https://github.com/cloudera/hue/tree/master/master/master/master/desktop/libs/hadoop/gen-py/gen-py/gen-py/hadoop/hadoop/hadoop/api/hdfs/api/hdfs/pi/hdfs/pi/hdfs/pi/hdfs-/papi https://github.com/clouder.com/>
hdfs.thrift https://github.com/cloudera/hue/blob/master/master/desktop/libs/hadoop/java/java/java/if/hdfs.thrift