我已经调查了Oozie和Azkaban,但我认为它们仅用于安排一些工作。
DW通常需要大量的作业来安排,是否有一个好的框架?
您可以使用Pentaho数据集成工具。看看这个。http://www.pentaho.com/product/data-integration
您还可以在基于 Hadoop的仓库中查看 Talend 的数据集成。它提供了图形工具来创建Hadoop组件之间的数据集成流,并且它也是开源的。
请检查 http://www.talend.com/resource/hadoop-tools.html