控制Tensorboard监控训练的时间,同时在多个数据集上拟合模型



我正在训练一个在几个数据集上循环的模型

tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=log_dir, 
histogram_freq=1,
profile_batch=10)
for data in datasets:
model.fit(data,callbacks=[tensorboard_callback])

我正在尝试通过这个数据集监控GPU的使用情况。然而,Tensorboard只能收集一秒钟左右的数据。之后它就会停止。此外,这似乎表明gpu在训练中的使用几乎是完美的。

我试着绕过我传递给Tensorboard的论点,但我觉得离达成解决方案还差得很远。那么,Tensorboard是如何收集数据的呢?

在使用Tensorboard收集有用的数据之前,我是否必须将所有数据收集到一个列表/数据帧中?

在for循环中添加tensorboard_recallback:

for data in datasets:
tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=log_dir, 
histogram_freq=1,
profile_batch=10)
model.fit(data,callbacks=[tensorboard_callback])

相关内容

最新更新