如何编辑现有的张量板训练损失摘要?



我已经训练了我的网络并生成了一些训练/验证损失,我通过以下代码示例保存了这些损失(仅训练损失的示例,验证是完全等效的(:

valid_summary_writer = tf.summary.create_file_writer("/path/to/logs/")
with train_summary_writer.as_default():
tf.summary.scalar('Training Loss', data=epoch_loss, step=current_step)

训练结束后,我想使用张量板查看损失曲线。但是,由于我将损失曲线保存在名称"训练损失"和"验证损失"下,因此这些曲线绘制在单独的图形上。我知道我应该将名称更改为简单的"损失",以解决此问题,以便将来写入日志目录。但是,如何编辑现有日志文件以了解训练/验证损失以说明这一点呢?

我试图修改以下帖子的解决方案:https://stackoverflow.com/a/55061404 编辑日志文件的步骤并重写文件; 我的版本涉及更改文件中的标签。但我在这方面没有成功。它还需要通过"tf.compat.v1"导入较旧的Tensorflow代码。有没有办法实现这一目标(也许在TF 2.X中(?

我曾想过简单地从包含损失的每个日志目录中获取损失和步骤值,并通过我之前的工作方法将它们写入新的日志文件,但我只设法获得了步骤,而不是损失值本身。有人在这里取得成功吗?

---=== 编辑 ===---

我设法使用@jhedesa中的代码解决了这个问题

我不得不稍微改变函数"rename_events_dir"的调用方式,因为我在Google Colab Notebook中协作使用Tensorflow。为此,我更改了代码的最后一部分,内容如下:

if __name__ == '__main__':
if len(sys.argv) != 5:
print(f'{sys.argv[0]} <input dir> <output dir> <old tags> <new tag>',
file=sys.stderr)
sys.exit(1)
input_dir, output_dir, old_tags, new_tag = sys.argv[1:]
old_tags = old_tags.split(';')
rename_events_dir(input_dir, output_dir, old_tags, new_tag)
print('Done')

要阅读此内容:

rootpath = '/path/to/model/'
dirlist = [dirname for dirname in os.listdir(rootpath) if dirname not in ['train', 'valid']]
for dirname in dirlist:
rename_events_dir(rootpath + dirname + '/train', rootpath + '/train', 'Training Loss', 'loss')
rename_events_dir(rootpath + dirname + '/valid', rootpath + '/valid', 'Validation Loss', 'loss')

请注意,我调用了两次"rename_events_dir",一次用于编辑训练损失的标签,一次用于验证损失标签。我本可以使用以前的方法通过设置"old_tags = '训练损失;验证损失",并使用"old_tags = old_tags.split(';')"拆分标记。我使用我的方法只是为了理解代码以及它如何处理数据。

如如何在 Tensorboard 中加载选定范围的样本中所述,TensorBoard 事件实际上是存储的记录文件,因此您可以读取它们并对其进行处理。这是一个类似于那里发布的脚本,但用于重命名事件,并更新为在TF 2.x中工作。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# rename_events.py
import sys
from pathlib import Path
import os
# Use this if you want to avoid using the GPU
os.environ['CUDA_VISIBLE_DEVICES'] = '-1'
import tensorflow as tf
from tensorflow.core.util.event_pb2 import Event
def rename_events(input_path, output_path, old_tags, new_tag):
# Make a record writer
with tf.io.TFRecordWriter(str(output_path)) as writer:
# Iterate event records
for rec in tf.data.TFRecordDataset([str(input_path)]):
# Read event
ev = Event()
ev.MergeFromString(rec.numpy())
# Check if it is a summary
if ev.summary:
# Iterate summary values
for v in ev.summary.value:
# Check if the tag should be renamed
if v.tag in old_tags:
# Rename with new tag name
v.tag = new_tag
writer.write(ev.SerializeToString())
def rename_events_dir(input_dir, output_dir, old_tags, new_tag):
input_dir = Path(input_dir)
output_dir = Path(output_dir)
# Make output directory
output_dir.mkdir(parents=True, exist_ok=True)
# Iterate event files
for ev_file in input_dir.glob('**/*.tfevents*'):
# Make directory for output event file
out_file = Path(output_dir, ev_file.relative_to(input_dir))
out_file.parent.mkdir(parents=True, exist_ok=True)
# Write renamed events
rename_events(ev_file, out_file, old_tags, new_tag)
if __name__ == '__main__':
if len(sys.argv) != 5:
print(f'{sys.argv[0]} <input dir> <output dir> <old tags> <new tag>',
file=sys.stderr)
sys.exit(1)
input_dir, output_dir, old_tags, new_tag = sys.argv[1:]
old_tags = old_tags.split(';')
rename_events_dir(input_dir, output_dir, old_tags, new_tag)
print('Done')

你会像这样使用它:

> python rename_events.py my_log_dir renamed_log_dir "Training Loss;Validation Loss" loss

最新更新