Redis Sentinel Slave SDOWN is set to True

>我编写了一个监控程序来监控我的 Redis Sentinel HA 集群的运行状况，它标记了一个从属节点 10.10.10.30 丢失。经过一些调试，事实证明，处于 sdown 状态 true 的从属服务器被过滤掉。

我的系统由三个节点组成，1个主节点，两个从节点。每个节点上都部署了哨兵。

在主服务器上，如果我登录到 redis-cli，则会报告以下内容：

127.0.0.1:6379> info replication
# Replication
role:master
connected_slaves:2
slave0:ip=10.10.10.8,port=6379,state=online,offset=1409435252945,lag=1
slave1:ip=10.10.10.30,port=6379,state=online,offset=1409436519147,lag=1
master_repl_offset:1409439031250
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1409437982675
repl_backlog_histlen:1048576

我所有的 redis 服务器以及每台机器上的哨兵都已启动并运行。

如果我在我的任何机器上执行 redis-cli -p 26379 并运行哨兵奴隶 mymaster。我收到与我配置和运行的从属服务器数量相同的报告。但是，节点 10.10.10.30 报告以下内容：

2)  1) "name"
2) "10.10.10.30:6379"
3) "ip"
4) "10.10.10.30"
5) "port"
6) "6379"
7) "runid"
8) ""
9) "flags"
10) "s_down,slave,disconnected"
11) "pending-commands"
12) "0"
13) "last-ping-sent"
14) "936737"
15) "last-ok-ping-reply"
16) "936737"
17) "last-ping-reply"
18) "936737"
19) "s-down-time"
20) "931725"
21) "down-after-milliseconds"
22) "5000"
23) "info-refresh"
24) "1589412820130"
25) "role-reported"
26) "slave"
27) "role-reported-time"
28) "936737"
29) "master-link-down-time"
30) "0"
31) "master-link-status"
32) "err"
33) "master-host"
34) "?"
35) "master-port"
36) "0"
37) "slave-priority"
38) "100"
39) "slave-repl-offset"
40) "0"

我不明白如何让该节点脱离关闭状态。所有 Redis 计算机和哨兵部署都分别使用端口 6379 和 26379，并且端口可访问。

我将redis.conf和sentinel.conf与没有问题的奴隶进行了比较。区别在于绑定地址。我将其从 127.0.0.1 更改为绑定 0.0.0.0 并重新启动 redis 并重新启动。下降状态消失了。

相关内容

最新更新

热门标签：