我有兴趣了解Flink在内部工作的工作原理,但是我正在努力寻找内部代码的文档(例如,工作的起点(,所以我无法理解代码库。想要为那些想flink本身做出贡献的人是否有文档或进行演练?
我发现,如果您了解Flink的某些部分的工作原理,则源代码通常是可以理解的。然后,最初的挑战是正确理解代码的预期行为。为此,这里有一些有用的资源:
最好的起点是Fabian Hueske和Vasiliki Kalavri的Apache Flink进行流处理。
近年来,任何在弗林克上进行的重大开发工作均在弗林克的改进建议之前进行。这些可能是最佳可用资源,以更深入地了解代码的特定主题和领域。
该文档具有有关"内部"的部分,该部分涵盖了一些主题。
,还有一些出色的Flink Forward Talk,描述了某些内部人士如何工作,例如Aljoscha Krettek关于正在进行的统一工作的演讲,Nico Kruber在网络堆栈中的演讲,Stefan Richter在State和Checkpoint上的演讲,Piotr Nowojski关于两个阶段提交汇的演讲,以及Addison Higham关于操作员的演讲。