对象检测Tensorflow 2.6-如何保存所有检查点并为所有检查点运行eval



目标检测Tensorflow 2.6 -

在训练模型时,只有最后7个检查点被保存。旧的被覆盖。如何保存所有检查点以及如何为所有这些检查点运行eval模型。只取最后一个检查点值用于求值

我试图同时运行train和eval,出现内存不足错误。

tr .train. saver()构造函数接受一个名为max_to_keep的可选参数,该参数默认保留模型最近的5个检查点。要保存更多的模型,只需为该参数指定一个值:

要保留所有检查点,传递参数max_to_keep=None

max_to_keep-最近要保留的检查点文件的最大数目。随着新文件的创建,旧文件被删除。如果为None或0,则不会从文件系统中删除检查点,但检查点文件中只保留最后一个检查点。默认为5(也就是说,保留最近的5个检查点文件。)

keep_checkpoint_every_n_hours-除了保持最新的max_to_keep检查点文件,你可能想要保持一个检查点文件为每N小时的训练。如果您稍后想要分析一个模型在长时间训练过程中的进展情况,这将非常有用。例如,传递keep_checkpoint_every_n_hours=2可以确保每2小时的训练保留一个检查点文件。默认值10,000小时有效禁用该功能。

最新更新