在处理 apache beam 框架时,Python 和 java 有什么区别?



在编写apache梁管道时,我使用了python。我注意到了一些限制,比如处理延迟数据等。我想知道与Java 相比是否还有其他限制或优势

从2019年秋季开始,我们可以考虑使用python SDK来提供java SDK的一个子集功能。

您可以使用的I/O转换更少(可能与其他系统、数据存储、消息队列等集成(。文档在此处提供了java与python中支持的I/O转换列表:https://beam.apache.org/documentation/io/built-in/

您还可以使用更少的聚合转换(例如,python端缺少Min和Max(,尽管随着人们对社区的贡献,这种情况越来越好(请参阅https://issues.apache.org/jira/browse/BEAM-6695)。

根据我个人的经验,缺乏sql数据库连接是我用java编写管道的障碍,实际上是:(。

最新更新