如何使用Oozie协调员延迟工作流操作



我有一个oozie协调员和工作流工作,当我的一个工作流操作完成时,我需要在一段时间后开始下一个操作,比如 50 分钟。我可以从oozie工作流程或oozie协调器配置它以等待一段时间以执行下一个操作(取决于以前的操作和上一个启动的某些异步任务)。

协调器 XML

<coordinator-app name="ods-ds-cms-coordinator" start="${startTime}" end="${endTime}"
                 frequency="${coord:days(1)}" timezone="${timeZone}" xmlns="uri:oozie:coordinator:0.5">
    <action>
        <workflow>
            <app-path>${exampleDir}/ods-ds-cms-workflow.workflow</app-path>
            <configuration>
                <property>
                    <name>nameNode</name>
                    <value>${nameNode}</value>
                </property>
                <property>
                    <name>jobTracker</name>
                    <value>${jobTracker}</value>
                </property>
                <property>
                    <name>exampleDir</name>
                    <value>${nameNode}/custom/oozie</value>
                </property>
            </configuration>
        </workflow>
    </action>
</coordinator-app>

工作流程.xml

<?xml version="1.0" encoding="UTF-8"?>
<workflow-app xmlns="uri:oozie:workflow:0.5" name="ods-ds-cms-workflow.workflow">
  <global>
    <job-tracker>${jobTracker}</job-tracker>
    <name-node>${nameNode}</name-node>
    <configuration>
      <property>
        <name>mapred.job.queue.name</name>
        <value>${queue}</value>
      </property>
    </configuration>
  </global>
  <start to="cms-checker"/>
  <action name="cms-checker">
    <java>
      <main-class>com.insense.helper.CMSPullChecker</main-class>
      <arg>${cmsChecker}</arg>
      <arg>${cmsType}</arg>
      <capture-output/>
    </java>
    <ok to="trigger_next_job"/>
    <error to="kill"/>
  </action>
  <action name="trigger_next_job"> // need to start this after some time
    <sub-workflow>
      <app-path>${exampleDir}/ods-ds-bank.workflow</app-path>
      <propagate-configuration/>
    </sub-workflow>
  <ok to="end"/>
  <error to="kill"/>
  </action>

我如何使用 oozie 框架进行存档,我可以使用 Thread.sleep(50*60*1000) 的 java 操作来做到这一点,使用 oozie 是更好的方法吗?

您可以创建另一个仅包含一个作业的工作流 - Shell 作业。然后你应该使用一个命令创建 shell 脚本:

sleep 50m

当一个工作流完成时,您应该使用sleep命令执行此工作流。下一个工作流将在 50 分钟后启动。

例。

工作流程.xml

<workflow-app name="My_Workflow" xmlns="uri:oozie:workflow:0.5">
<start to="shell-3322"/>
<kill name="Kill">
    <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
</kill>
<action name="shell-3322">
    <shell xmlns="uri:oozie:shell-action:0.1">
        <job-tracker>${jobTracker}</job-tracker>
        <name-node>${nameNode}</name-node>
        <exec>sleep.sh</exec>
        <file>sleep.sh#sleep.sh</file>
          <capture-output/>
    </shell>
    <ok to="End"/>
    <error to="Kill"/>
</action>
<end name="End"/>

sleep.sh

sleep 50m

最新更新