小贝子编程

哪个是更有效的编排机制，链接Databricks笔记本在一起或使用Apache气流?

本文关键字：在一起笔记本 Databricks 气流 Apache 链接有效机制 google-bigquery airflow databricks google-cloud-composer orchestration
更新时间 : 2023-09-23
英文 : Which is a more efficient orchestrating mechanism, chaining Databricks notebooks together or using Apache Airflow?

数据的大小以tb为单位

我有多个Databricks笔记本，用于为每个维度表加载增量数据到Google BigQuery。

现在，我必须每两个小时执行一次数据加载，即运行这些笔记本。

下面哪一种方法更好:

当我有并行执行和顺序执行笔记本的用例时，我想知道哪种方法更好。

如果我能得到关于这个话题的建议或意见，我将非常感激，谢谢。

你为什么不能尝试一下数据块的工作呢?因此，您可以使用job来运行笔记本，无论是立即运行还是定期运行。

相关内容