我在networkx
中有一个有向无环图。每个节点代表一个任务,节点的前置任务是任务依赖项(给定任务在其依赖项执行之前无法执行)。
我想在异步任务队列中"执行"图形,类似于celery
提供的内容(以便我可以轮询作业以获取其状态、检索结果等)。Celery 不提供创建 DAG 的能力(据我所知),并且能够在所有依赖项完成后立即移动到task
将是至关重要的(DAG 可能有多个路径,即使一个任务很慢/阻塞,也可以继续执行其他任务等)。
有没有关于我如何实现这一目标的简单例子,甚至可能networkx
与celery
集成?
可用于此目的的一个库是任务图。它允许您定义任务图,然后以多线程/多进程方式执行这些任务。它避免了重新运行结果已经是最新的任务,类似于 make 程序。
要执行 networkx 图,您需要按拓扑顺序迭代所有节点,收集每个节点的不真实依赖项,然后调用 task_graph.add_task
。此函数将返回新添加任务的句柄,该句柄允许您将其用作后续添加任务的依赖项(这就是节点迭代顺序很重要的原因)
有关替代解决方案,另请参阅此问题。
我参加聚会有点晚了,但一种可能性是使用 dask
构造自定义 DAG,然后执行它们,请参阅 https://docs.dask.org/en/stable/graphs.html。
我认为这个函数可能会有所帮助:
# The graph G is represened by a dictionnary following this pattern:
# G = { vertex: [ (successor1: weight1), (successor2: weight2),... ] }
def progress ( G, start ):
Q = [ start ] # contain tasks to execute
done = [ ] # contain executed tasks
while len (Q) > 0: # still there tasks to execute ?
task = Q.pop(0) # pick up the oldest one
ready = True
for T in G: # make sure all predecessors are executed
for S, w in G[T]:
if S == task and and S not in done:# found not executed predecessor
ready = False
break
if not ready : break
if not ready:
Q.appen(task) # the task is not ready for execution
else:
execute(task)
done.appen(task) # execute the task
for S, w in G[task]:# and explore all its successors
Q.append(S)