用Open Images数据集重新训练im2txt模型



我有一个训练有素的im2txt模型(https://github.com/tensorflow/models/tree/master/im2txt)。我使用了MSCOCO图像集进行培训,因为它是在文档中编写的。

我想继续使用Google Open Images Dataset进行训练。

我想知道是否有可能重新训练im2txt模型,以及我需要做什么来为训练准备一个新的数据集。Google数据集和MSCOCO数据集似乎有不同的格式。

虽然有可能重新训练模型,但请记住,这两个数据集具有不同的标记语义和约定,因此要理解结果可能不是100%可比较的。

您需要使用类似于COCO脚本的脚本对数据进行预处理。

在openimages发行版中提供了一个用于推断的脚本,但它确实包含解包数据的代码。

最后,如果你完成了这个,我们总是在我们的github模型页面上以拉取请求的形式开放贡献。

最新更新