我有一个程序,它在本地集群中运行良好,但在远程集群上执行时无法正常运行。我想知道,调试在远程 Flink 集群上运行的程序的最佳和常用方法是什么?任何帮助不胜感激!
几种方法可以在远程集群上调试 Flink 应用程序。由于使用真正的调试器很复杂,因此我将首先尝试尽可能多地记录以找出错误。
另一种可能有用的方法是使用 Flink 的累加器。有了它们,你可以收集一些统计数据:例如,当你有一个过滤器时,你可以确定有多少元素通过了过滤器等等。
最后的手段是将调试器附加到其中一个 Flink TaskManager JVM。
另请查看我关于该主题的演示文稿:http://de.slideshare.net/robertmetzger1/apache-flink-hands-on