我正在尝试保存模型的迭代检查点,以及保存在独立验证数据集上获得最佳分数的模型。但是,我的检查点会覆盖我的最佳模型。实际上,我正在使用以下内容:
saver = tf.train.Saver()
with tf.Session() as sess:
for epoch in range(20):
# Train model [...]
# and save a checkpoint
saver.save(sess, "iter", global_step=epoch)
if best_validiation_acc < last_validation_acc:
saver.save(sess, "best_model")
如何让我的最佳模型不被迭代保存覆盖?
原因是您对两者使用相同的tf.train.Saver
,因此无论您如何命名它们,它都会记住最后max_to_keep=5
检查点文件。
最简单的解决方案是设置 max_to_keep=None
,这将强制保护程序保留所有检查点并且不覆盖任何内容。但是,您可能希望至少覆盖迭代检查点。在这种情况下,解决方案是:
iter_saver = tf.train.Saver(max_to_keep=3) # keep 3 last iterations
best_saver = tf.train.Saver(max_to_keep=5) # keep 5 last best models
with tf.Session() as sess:
for epoch in range(20):
# Train model [...]
# and save a checkpoint
iter_saver.save(sess, "iter/model", global_step=epoch)
if best_validiation_acc < last_validation_acc:
best_saver.save(sess, "best/model")
我还将使用不同的目录,以便checkpoint
文件不会发生冲突。