Hadoop中的数据仓库是否有一个好的ETL框架



我已经调查了Oozie和Azkaban,但我认为它们仅用于安排一些工作。

DW通常需要大量的作业来安排,是否有一个好的框架?

您可以使用Pentaho数据集成工具。看看这个。http://www.pentaho.com/product/data-integration

您还可以在基于 Hadoop的仓库中查看 Talend 的数据集成。它提供了图形工具来创建Hadoop组件之间的数据集成流,并且它也是开源的。

请检查 http://www.talend.com/resource/hadoop-tools.html

相关内容

最新更新