如何在预先执行模式下使用 tf.data 数据集



>在2018年TensorFlow Dev峰会的tf.data演讲中,Derek Murray提出了一种将tf.data API与TensorFlow的急切执行模式相结合的方法(10:54(。我尝试了那里显示的代码的简化版本:

import tensorflow as tf
tf.enable_eager_execution()
dataset = tf.data.Dataset.from_tensor_slices(tf.random_uniform([50, 10]))
dataset = dataset.batch(5)
for batch in dataset:
    print(batch)

造成

TypeError: 'BatchDataset' object is not iterable

我还尝试使用 dataset.make_one_shot_iterator()dataset.make_initializable_iterator() 来迭代数据集,但它们的结果是

RuntimeError: dataset.make_one_shot_iterator is not supported when eager execution is enabled.

RuntimeError: dataset.make_initializable_iterator is not supported when eager execution is enabled.

TensorFlow版本:1.7.0,Python版本:3.6

如何使用 tf.data API 并快速执行?

make_one_shot_iterator()应该在TensorFlow 1.8中工作,但现在(即对于TensorFlow 1.7(,请执行以下操作:

import tensorflow.contrib.eager as tfe
dataset = tf.data.Dataset.from_tensor_slices(tf.random_uniform([50, 10]))
dataset = dataset.batch(5)
for batch in tfe.Iterator(dataset):
     print(batch)

使用 TF 2.1

您可以像这样创建一个迭代器:

iterator = iter(dataset)

并获取下一批值:

batch = iterator.get_next()

最新更新