我使用 Jenkins 每小时运行一个spark-submit
,并设置--deploy-mode cluster
。是否推荐使用方法?因为有些事情似乎不起作用。
当我转到我的 Spark 服务器并按应用程序名称时,它会尝试转到该端口(防火墙)而不是服务器上的计算机。有了--deploy-mode cluster
我希望能够在火花大师上看到这一点,因为spark-submit
会立即以这种模式返回。
另外,我似乎无法打开DAG。这有关系吗?
我使用的完整命令是spark-submit --master spark://mysparkserver:6066 --deploy-mode cluster --class someClass --conf spark.driver.userClassPathFirst=true http://theJarUrl
找到了!尽管您可以在 Spark 主机上启用事件日志记录,但您还需要使用 --conf spark.eventLog.enabled=true --conf spark.eventLog.dir=/opt/spark/spark-events
在 spark-submit
中指定它。之后,您可以通过单击应用程序名称在火花母版上观看事件。它还将能够检查已完成的应用程序。
尽管如此,DAG 可视化仍然对我不起作用。如果有人对此有建议,请发表评论。