我希望通过在第二个实例的docker-compose.yml
文件上使用以下片段,这将是一个简单的过程
- DOCKER_VERNEMQ_DISCOVERY_NODE=<ip address of the first instance>
但这似乎不起作用。
第二个实例的日志确认它正在尝试集群:
13:56:09.795 [info] Sent join request to: 'VerneMQ@<ip address of the first instance>'
13:56:16.800 [info] Unable to connect to 'VerneMQ@<ip address of the first instance>'
而第一个实例的日志根本没有显示任何内容。
从第二个实例中,我可以确认端点是可访问的:
$ docker exec -it vernemq /bin/sh
$ curl <ip address of the first instance>:44053
curl: (56) Recv failure: Connection reset by peer
然后在第一个实例的日志中,我看到了一个完全预料到的错误,并确认我已经到达了第一个实例
13:58:33.572 [error] CRASH REPORT Process <0.3050.0> with 0 neighbours crashed with reason: bad argument in vmq_cluster_com:process_bytes/3 line 142
13:58:33.572 [error] Ranch listener {{172,19,0,2},44053} terminated with reason: bad argument in vmq_cluster_com:process_bytes/3 line 142
这可能与以下事实有关:从docker容器内看到的ip地址是172.19.0.2
,而外部地址是10. ...
。
还尝试将第一个实例的主机名添加到known_hosts
,但没有成功。
请告知。
我使用的是erlio/doker vernemq:1.10.0
$ docker --version
Docker version 19.03.13, build 4484c46d9d
$ docker-compose --version
docker-compose version 1.27.2, build 18f557f9
我通过创建一个docker覆盖网络来对其进行排序
在机器1:docker swarm init
在机器2:docker swarm join --token ...
在机器1:docker network create --driver=overlay --attachable vernemq-overlay-net
上
我的dockerfile的相关部分是:
version: '3.6'
services:
vernemq:
container_name: ${NODE_NAME:?Node name not specified}
image: vernemq/vernemq:1.10.4.1
environment:
- DOCKER_VERNEMQ_NODENAME=${NODE_NAME:?Node name not specified}
- DOCKER_VERNEMQ_DISCOVERY_NODE=${DISCOVERY_NODE:-}
networks:
default:
external:
name: vernemq-overlay-net
具有以下env-var:
机器1:
- NODE_NAME=vernemq1.example.com
- DISCOVERY_NODE=
机器2:
- NODE_NAME=vernemq2.example.com
- DISCOVERY_NODE=vernemq1.example.com
注意:
据我记忆所及,由于docker compose中的一个错误,machine2很可能找不到vernemq-overlay-net
在这种情况下,您使用docker:docker run -dit --name alpine --net=vernemq-overlay-net alpine
启动一个容器,这将使其可用于docker compose。