集群运行在不同机器上的vernemq-doker容器



我希望通过在第二个实例的docker-compose.yml文件上使用以下片段,这将是一个简单的过程

- DOCKER_VERNEMQ_DISCOVERY_NODE=<ip address of the first instance> 

但这似乎不起作用。

第二个实例的日志确认它正在尝试集群:

13:56:09.795 [info] Sent join request to: 'VerneMQ@<ip address of the first instance>'
13:56:16.800 [info] Unable to connect to 'VerneMQ@<ip address of the first instance>'

而第一个实例的日志根本没有显示任何内容。

从第二个实例中,我可以确认端点是可访问的:

$ docker exec -it vernemq /bin/sh
$ curl <ip address of the first instance>:44053
curl: (56) Recv failure: Connection reset by peer

然后在第一个实例的日志中,我看到了一个完全预料到的错误,并确认我已经到达了第一个实例

13:58:33.572 [error] CRASH REPORT Process <0.3050.0> with 0 neighbours crashed with reason: bad argument in vmq_cluster_com:process_bytes/3 line 142
13:58:33.572 [error] Ranch listener {{172,19,0,2},44053} terminated with reason: bad argument in vmq_cluster_com:process_bytes/3 line 142

这可能与以下事实有关:从docker容器内看到的ip地址是172.19.0.2,而外部地址是10. ...

还尝试将第一个实例的主机名添加到known_hosts,但没有成功。

请告知。

我使用的是erlio/doker vernemq:1.10.0

$ docker --version
Docker version 19.03.13, build 4484c46d9d
$ docker-compose --version
docker-compose version 1.27.2, build 18f557f9

我通过创建一个docker覆盖网络来对其进行排序

在机器1:docker swarm init
在机器2:docker swarm join --token ...
在机器1:docker network create --driver=overlay --attachable vernemq-overlay-net

我的dockerfile的相关部分是:

version: '3.6'
services:
vernemq:
container_name: ${NODE_NAME:?Node name not specified}
image: vernemq/vernemq:1.10.4.1
environment:
- DOCKER_VERNEMQ_NODENAME=${NODE_NAME:?Node name not specified}
- DOCKER_VERNEMQ_DISCOVERY_NODE=${DISCOVERY_NODE:-}
networks:
default:
external:
name: vernemq-overlay-net

具有以下env-var:

机器1:

  • NODE_NAME=vernemq1.example.com
  • DISCOVERY_NODE=

机器2:

  • NODE_NAME=vernemq2.example.com
  • DISCOVERY_NODE=vernemq1.example.com

注意:
据我记忆所及,由于docker compose中的一个错误,machine2很可能找不到vernemq-overlay-net
在这种情况下,您使用docker:docker run -dit --name alpine --net=vernemq-overlay-net alpine启动一个容器,这将使其可用于docker compose。

相关内容

  • 没有找到相关文章

最新更新