我在 Centos7 中使用 Pacemaker + Corosync当我的一个资源失败/停止时,我/正在收到失败的操作消息:
Master/Slave Set: myoptClone01 [myopt_data01]
Masters: [ pcmk01-cr ]
Slaves: [ pcmk02-cr ]
myopt_fs01 (ocf::heartbeat:Filesystem): Started pcmk01-cr
myopt_VIP01 (ocf::heartbeat:IPaddr2): Started pcmk01-cr
ServicesResource (ocf::heartbeat:RADviewServices): Started pcmk01-cr
Failed Actions:
* ServicesResource_monitor_120000 on pcmk02-cr 'unknown error' (1): call=141, status=complete, exitreason='none',
last-rc-change='Mon Jan 30 10:19:36 2017', queued=0ms, exec=142ms
有没有办法在 X 秒/分钟/小时后自动清理失败的操作?
查看"失败超时"资源选项。如果在故障超时值内未发生特定资源的进一步故障,这将自动清理失败的操作。
我相信故障超时是在集群重新检查间隔期间计算的。这意味着,即使您将故障超时配置为 1 分钟,仍可能需要长达 15 分 59 秒才能使用 Pacemaker 默认的 15 分钟集群重新检查间隔清除失败的操作。
更多信息:
http://clusterlabs.org/doc/en-US/Pacemaker/1.1/html/Pacemaker_Explained/s-failure-migration.html
http://clusterlabs.org/doc/en-US/Pacemaker/1.1/html/Pacemaker_Explained/s-resource-options.html