如何在 apache flink 上运行用 python 编写的 beam 管道



我用python sdk来编写我的光束管道。我正在使用芹菜作为直接跑步者的包装纸。 我想使用 flink 运行器来并行处理我的负载。

根据文档,您需要将作业作为 flink 运行器的 jar 文件。

你能指出我可以同时使用apache beam python sdk和apache flink的任何资源吗? 有样品吗?

目前(Apache Beam 2.2.0)不支持Apache Beam Python SDK的Apache Flink Runner。当你尝试在Python管道中使用FlinkRunner时,你会得到ValueError

值错误:意外的管道运行程序:FlinkRunner。有效值为 DirectRunner、EagerRunner、DataflowRunner、TestDataflowRunner 或 PipelineRunner 子类的完全限定名称。

您可以在源代码中看到这一点,如下所示:https://github.com/apache/beam/blob/d11b9e9560131f55b418a13a7d10401c2135fb33/sdks/python/apache_beam/runners/runner.py#L62

相关内容

  • 没有找到相关文章

最新更新