PIG脚本,Hive查询和相应的MapReduce代码的包装代码



我正在处理 2 个数据集。我有MapReduce那些,然后通过PIG和HIVE对输出进行操作。我想按顺序一次执行所有这些步骤。我应该如何将这些东西包装到一个单独的 scritp 中,即 Map Reduce 代码,然后是 PIG 脚本,最后是几个 Hive 查询。

谢谢基坦

您需要将它们包装在 Oozie 工作流程中。Oozie 使您能够运行在 DAG 中排列的操作集合 - 检查此链接

他们有很好的文档,所以你可以从这个开始。

最新更新