如何从h5文件中提取图像和标题数据集



我想使用FashionGen数据集,该数据集具有用于训练和验证数据的2 h5格式文件。h5文件的数据集列表如下所示:指数索引2输入品牌输入类别输入_组合input_concat_description输入_部门输入description输入_发送器输入图像输入_msrpUSDinput_name输入_输出input_productID输入_原因输入_子类别

我只需要";Input_image"以及";Input_description"数据集。你介意帮帮我吗?

详细信息取决于数据集dtypeshape以及要创建的Python对象。这个代码会让你开始。查看h5py文档了解详细信息。h5py快速入门指南。注意:数据集和组名称区分大小写。请务必验证它们是"Input_image"还是"input_image"

with h5py.File(filename,'r') as h5f:
# create NumPy array from image dataset:
image_arr = h5f['input_image'][:]
# create NumPy array from description dataset:
descr_arr = h5f['input_description'][:] 

注意:如果数据集太大而无法放入内存,则可以使用h5py数据集对象并将其作为NumPy数组进行引用。代码非常相似。见下文:

with h5py.File(filename,'r') as h5f:
# create h5py object of images dataset:
image_ds = h5f['input_image']
# create NumPy object of description dataset:
descr_ds = h5f['input_description'] 

最新更新