我正在尝试生成综合手写数据。我遇到了甘被用来生成单个角色图像。
生成器:将随机张量调整为图像。
歧视器:使用真实数据对真实/生成进行分类。
,但我们无法控制所需的角色输出。
我有一个手写的数据集,其中包含单词(IAM)的图像。
如果对于单词级别,我们需要每个单词的单独gan?
我需要将输出图像注释到一个单词(用于单词识别)。
是否有一个GAN网络输出单词的合成手写图像,而不是在培训数据集中?
您正在使用具有两个部分的gan网络:
-
Generator :它将随机噪声构成图像。它是使用歧视者产生的损失进行训练的。
-
歧视器:它区分了真实图像和预测图像。因此,计算损失。
鉴别器匹配真实和预测的图像。如果我向歧视器显示字符" 2"的图像,则将将预测与该图像进行比较。因此,将计算损失,并将发电机从该损失中学习。
因此,如果您显示字符" 3"的图像,那么生成器将尝试生成字符" 3"的图像,以便它可以 fool
您通过向发电机提供不同的图像,您可以将随机噪声伪造成任何所需的输出。