暂停训练以在 CIFAR-10 教程中的单个 GPU 上运行评估



我正在尝试理解Tensorflow网站上的CIFAR-10教程。我可以启动并运行培训,但我对评估部分有点困惑。它在此链接中说评估是定期运行的,但我似乎在代码中找不到任何支持这一点的地方。

我如何实现这一点,以便在一定数量的步骤后暂停培训并定期运行评估,甚至更好地运行评估?

您必须在训练的同时运行python cifar10_eval.py,以便定期进行评估(例如在另一个终端中(。您可以在参数中选择希望运行评估的频率。

但是,如您提供的链接中所述,您可能需要在不同的设备(最好是另一个 GPU(上运行它,以避免在训练的同时运行的评估导致内存问题。

相关内容

  • 没有找到相关文章