我是Oozie的新手。有人能帮我满足这个要求吗?
我有一个Java代码,因为我有一个保存文件名的ArrayList
。假设我的ArrayList
包含10个文件,然后循环通过列表中的每个文件,我必须在Oozie中调用另一个Pig
和Hive
动作。
我对此进行了研究,发现Oozie不支持直接循环,我可能不得不使用oozie sub workflows
。
所以有人能帮我解决这个问题的方法吗?
oozie不支持循环。
在你的情况下,我建议采用以下方法。
- 创建一个Java代码,动态生成工作流。xml。
- 这个工作流.xml应该有你的第一个java动作,然后是内部的蜂巢和猪动作,然后一次又一次地迭代这些动作,直到循环结束。注意动作名称应该有一些标志,这样每个循环动作有不同的名字,oozie才会执行工作流。
你的工作流程会说:
循环1 - Javaction1, hiveaction1和pigaction1
循环2。Javaction2、hiveaction2和pigaction2
希望能有所帮助。