当"rados列表不一致pg";返回几个不一致的pg,如["1.12"、"1.2c"、"1.27"、"1.57"]、"1.2d";rados列表不一致obj";给出";未知错误(1(不允许操作";。
我该怎么纠正他的错误?
--更新:
"ceph健康细节";退货:
HEALTH_ERR 8 scrub errors; Possible data damage: 4 pgs inconsistent
OSD_SCRUB_ERRORS 8 scrub errors
PG_DAMAGED Possible data damage: 4 pgs inconsistent
pg 1.12 is active+clean+inconsistent, acting [2,1]
pg 1.2c is active+clean+scrubbing+deep+inconsistent+repair, acting [2,1]
pg 1.2d is active+clean+inconsistent, acting [2,0]
pg 1.57 is active+clean+inconsistent, acting [1,2]
查看您的sudo ceph health detail
,首先要获得以下通用修复命令的帮助:
ceph pg repair {pgid}
在您的情况下,它将是:
ceph pg repair 1.12
ceph pg repair 1.2c
ceph pg repair 1.2d
ceph pg repair 1.57
此外,请尝试备份正在修复的PG副本。
Ceph修复的局限性:我的经验表明,Ceph修复不会自动修复放置组中发现的不一致。例如,这也解释了为什么修复不会自动解决它。你有可能不得不像这样手动诊断。
深入挖掘:除此之外,我还维护了以下有助于解决集群中PG不一致的注释:
-
PG与空不一致对象不一致
-
如何从活动+清理+不一致+故障修复中恢复?
-
擦除错误/ceph pg修复是如何工作的?
-
PG显示不一致的活动+清洁+不一致的