从项目中获取用例并解释每个用例的用法将是非常棒的。提前谢谢。
TFRecordDataset
、FixedLengthRecordDataset
和TextLineDataset
是Dataset
的一类。
Dataset是一个基类,包含创建和转换数据集的方法。还允许您从内存中的数据或从Python生成器初始化数据集。
自1.4版以来,Datasets是一种创建TensorFlow模型输入管道的新方法。这个API比使用feed_dict或基于队列的管道性能要高得多,而且更干净,更容易使用。
作为一个用例,您可以考虑将数据预处理以将其馈送到训练模型中(下面链接中的示例非常不言自明)。
- TFRecordDataset:读取TFRecord文件中的记录(例1,例2)。
#Python
dataset = tf.data.TFRecordDataset("/path/to/file.tfrecord")
- FixedLengthRecordDataset:从二进制文件中读取固定大小的记录。
#Python
images = tf.data.FixedLengthRecordDataset(
images_file, 28 * 28, header_bytes=16).map(decode_image)
- TextLineDataset:从文本文件读取行。
查看此文档(包括textlinedatasset示例)