如何在 tf.estimator 的input_fn中使用 tf.data 的可初始化迭代器？

我想用tf.estimator.Estimator来管理我的训练，但在与tf.dataAPI一起使用时遇到了一些麻烦。

我有这样的东西：

def model_fn(features, labels, params, mode):
# Defines model's ops.
# Initializes with tf.train.Scaffold.
# Returns an tf.estimator.EstimatorSpec.
def input_fn():
dataset = tf.data.TextLineDataset("test.txt")
# map, shuffle, padded_batch, etc.
iterator = dataset.make_initializable_iterator()
return iterator.get_next()
estimator = tf.estimator.Estimator(model_fn)
estimator.train(input_fn)

由于我不能为我的用例使用make_one_shot_iterator，我的问题是input_fn包含一个应该在model_fn内初始化的迭代器(在这里，我使用tf.train.Scaffold来初始化本地操作(。

另外，我知道我们不能只使用input_fn = iterator.get_next否则其他操作将不会添加到同一图形中。

初始化迭代器的推荐方法是什么？

从 TensorFlow 1.5 开始，可以使input_fn返回一个tf.data.Dataset，例如：

def input_fn():
dataset = tf.data.TextLineDataset("test.txt")
# map, shuffle, padded_batch, etc.
return dataset

参见 c294fcfd。

对于以前的版本，可以在tf.GraphKeys.TABLE_INITIALIZERS集合中添加迭代器的初始值设定项，并依赖默认初始值设定项。

tf.add_to_collection(tf.GraphKeys.TABLE_INITIALIZERS, iterator.initializer)

相关内容

最新更新

热门标签：