受监控的培训课程保存所有检查点



使用 tf.train.MonitoredTrainingSession 时,是否可以保存所有检查点。它有一个参数( save_checkpoint_secs=600 (来指定我们要保存多少检查点,但没有选项可以指定您可以保存多少个检查点。

使用简单tf.train.Saver()时,有一个选项可以指定max_to_keep

您可以使用tf.train.Scaffold传递tf.train.Savertf.train.MonitoredTrainingSession

import tensorflow as tf
scaffold = tf.train.Scaffold(saver=tf.train.Saver(max_to_keep=10))
with tf.train.MonitoredTrainingSession(scaffold=scaffold) as sess:
    ...

很抱歉来得有点晚了。如果您使用的是 tf.train.saver,则不会从受监控的会话中指定任何保护程序信息,否则来自保护程序的所有信息都将被覆盖

最新更新