当我启动集群时,登录任务管理器是这样的:
INFO org.apache.flink.runtime.taskmanager.TaskManager - 尝试在作业管理器上注册 akka.tcp://flink@master1:6123/user/jobmanager (尝试 1,超时:500 毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 尝试在作业管理器上注册 akka.tcp://flink@master1:6123/user/jobmanager (尝试 2,超时: 1000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 尝试在作业管理器上注册 akka.tcp://flink@master1:6123/user/jobmanager (尝试 3,超时: 2000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 尝试在作业管理器上注册 akka.tcp://flink@master1:6123/user/jobmanager (尝试 4,超时: 8000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 尝试在作业管理器上注册 akka.tcp://flink@master1:6123/user/jobmanager (尝试 5,超时: 16000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 尝试在作业管理器上注册 akka.tcp://flink@master1:6123/user/jobmanager (尝试 6,超时: 30000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 尝试在作业管理器上注册 akka.tcp://flink@master1:6123/user/jobmanager (尝试 7,超时: 30000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 尝试在作业管理器上注册 akka.tcp://flink@master1:6123/user/jobmanager (尝试 8,超时: 30000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 尝试在作业管理器上注册 akka.tcp://flink@master1:6123/user/jobmanager (尝试 9,超时: 30000毫秒)
INFO org.apache.flink.runtime.taskmanager.TaskManager - 尝试在作业管理器上注册 akka.tcp://flink@master1:6123/user/jobmanager (尝试 10,超时: 30000毫秒)
似乎无法与JobManger联系,Bu Web UI可以看到任务管理器。 当我向集群提交作业时,作业管理器收到一些错误日志:
引起 :akka.pattern.AskTimeoutException:Recipient[Actor[akka://flink/deadLetters]] 已被终止
我想 akka 有一些错误,但我不知道如何解决它。 非常感谢你帮助我
最后,我自己解决了这个问题。flink 1.3.x 中存在一个错误,您的集群主机不得包含特殊字符。
在我的生产环境中,主机称为"flink_master"slaves_01"slaves_02"。"_"导致了此问题。似乎您只能使用字母数字和数字字符。当我将主机更改为"主"药膏1"奴隶2"时,它运行良好。