已创建hdfs集群。我必须配置yarn,以便允许yarn应用程序主能够根据需要在mesos集群上创建作业处理容器。
如何将HDFS集群与mesos基础设施集成,以便在mesos上创建容器?
我需要找出一种方法来运行由应用程序主创建的容器在YARN集群以外的另一个资源上(客户端节点,或边缘节点,或通过mesos infra旋转的资源)。基本上,我必须创建一个按需计算的集群,一旦纱线用完,它就可以运行纱线应用程序
Mesos是作为一个更通用的YARN版本创建的,它们并不是真正打算一起使用的(YARN应用程序不能部署到Mesos上)。Spark应用程序是整个Hadoop生态系统中唯一可以(独立)部署到两者上的进程。
值得指出的是,Mesos被移到了Apache Attic(编辑:似乎很快就移了出去,但从那以后就没有发布过)。换句话说,它被认为是过时的。通过一些配置,YARN可以运行普通的Docker容器,如果这就是您使用Mesos的目的。Apache Twill是一个用于在YARN之上创建分布式应用程序的库,但它也在Apache Attic中(并保留了下来)。
从Mesos应用程序与HDFS通信也不需要特殊的配置,只需要hadoop-client
依赖项和配置的core-site.xml
和hdfs-site.xml
文件