Hadoop NameNode从元数据备份中恢复

我正在尝试NN元数据恢复。我已经采取备份Namenode和日志节点元数据。它包含编辑日志和fimage。

在我的系统中有两个nn。我在两个nn上备份元数据(hdfs元数据&QJM元数据)。我想在最坏的情况下测试恢复程序。假设NNs和Journal节点都关闭了，元数据被完全删除。

我想从备份中恢复NN元数据并启动NN。我知道可能会有数据丢失，因为备份后所做的最新更改将会丢失。

步骤尝试:

另一种方法:恢复所有的编辑日志和fimage到hdfs和qjm目录，并启动NN，但仍然失败。

两个神经网络都下降了，我无法启动。我不想格式化hdfs，因为它会改变集群ID，备份将不可用。

因为最新的FsImage和Edit已经丢失或损坏，您应该尝试恢复元数据

./bin/hadoop namenode -recover

参考:NameNode Recovery Tools for Hadoop分布式文件系统
因为日志没有与namenode同步，你应该重新创建它

./bin/hdfs namenode -initializeSharedEdits
因为恢复的FsImage已经丢失了自上次备份以来更新的最新数据，您应该检查并删除损坏的数据

./bin/hadoop fsck -delete /

可以启用恢复标志启动namenode。Namenode恢复将处理损坏的元数据。

./bin/hadoop namenode -recover

启动所有JournalNode。确保你已经复制了fimage, fimage。md5和VERSION文件。然后执行hdfs namenode -initializeSharedEdits -force，只格式化JournalNode。然后启动NameNode(1)。这应该行得通。

相关内容