将文件从1个集群的本地计算机传输到另一个集群的hdfs



我有两个hadoop集群(A和B),想把一个文件从集群A的本地传输到集群B的HDFS。有办法吗?

我尝试了copyFromLocal和put,但看起来他们没有将文件复制到集群B的HDFS,并表明他们不受支持:copyFromLocal: Not supported

fyi:连接看起来是打开的,因为我可以从集群A的本地读取集群B的HDFS(hadoop fs-lshdfs://NNofB:port/path)

不确定是否有从HDFS->HDFS的直接方法,但您可以从ClusterA中的节点上的HDFS中get,将数据scp发送到ClusterB中的节点,然后将数据从ClusterB中该节点put发送到HDFS。

最新更新