使用 tf.train.MonitoredTrainingSession
时,是否可以保存所有检查点。它有一个参数( save_checkpoint_secs=600
(来指定我们要保存多少检查点,但没有选项可以指定您可以保存多少个检查点。
使用简单tf.train.Saver()
时,有一个选项可以指定max_to_keep
。
您可以使用tf.train.Scaffold
传递tf.train.Saver
到tf.train.MonitoredTrainingSession
:
import tensorflow as tf
scaffold = tf.train.Scaffold(saver=tf.train.Saver(max_to_keep=10))
with tf.train.MonitoredTrainingSession(scaffold=scaffold) as sess:
...
很抱歉来得有点晚了。如果您使用的是 tf.train.saver,则不会从受监控的会话中指定任何保护程序信息,否则来自保护程序的所有信息都将被覆盖