使用GAN的合成手写单词数据生成



我正在尝试生成综合手写数据。我遇到了甘被用来生成单个角色图像。

生成器:将随机张量调整为图像。

歧视器:使用真实数据对真实/生成进行分类。

,但我们无法控制所需的角色输出。

我有一个手写的数据集,其中包含单词(IAM)的图像。

如果对于单词级别,我们需要每个单词的单独gan?

我需要将输出图像注释到一个单词(用于单词识别)。

是否有一个GAN网络输出单词的合成手写图像,而不是在培训数据集中?

您正在使用具有两个部分的gan网络:

  • Generator :它将随机噪声构成图像。它是使用歧视者产生的损失进行训练的。

  • 歧视器:它区分了真实图像和预测图像。因此,计算损失。

鉴别器匹配真实和预测的图像。如果我向歧视器显示字符" 2"的图像,则将将预测与该图像进行比较。因此,将计算损失,并将发电机从该损失中学习。

因此,如果您显示字符" 3"的图像,那么生成器将尝试生成字符" 3"的图像,以便它可以 fool

您通过向发电机提供不同的图像,您可以将随机噪声伪造成任何所需的输出。

最新更新