如何在张量流中保存迭代模型和最佳模型



我正在尝试保存模型的迭代检查点,以及保存在独立验证数据集上获得最佳分数的模型。但是,我的检查点会覆盖我的最佳模型。实际上,我正在使用以下内容:

saver = tf.train.Saver()
with tf.Session() as sess:
    for epoch in range(20):
        # Train model [...]
        # and save a checkpoint 
        saver.save(sess, "iter", global_step=epoch)
        if best_validiation_acc < last_validation_acc:
            saver.save(sess, "best_model")

如何让我的最佳模型不被迭代保存覆盖?

原因是您对两者使用相同的tf.train.Saver,因此无论您如何命名它们,它都会记住最后max_to_keep=5检查点文件。

最简单的解决方案是设置 max_to_keep=None ,这将强制保护程序保留所有检查点并且不覆盖任何内容。但是,您可能希望至少覆盖迭代检查点。在这种情况下,解决方案是:

iter_saver = tf.train.Saver(max_to_keep=3)  # keep 3 last iterations
best_saver = tf.train.Saver(max_to_keep=5)  # keep 5 last best models
with tf.Session() as sess:
    for epoch in range(20):
        # Train model [...]
        # and save a checkpoint 
        iter_saver.save(sess, "iter/model", global_step=epoch)
        if best_validiation_acc < last_validation_acc:
            best_saver.save(sess, "best/model")

我还将使用不同的目录,以便checkpoint文件不会发生冲突。

最新更新