DCGAN, Pytorch and Numpy files



我是一个Pytorch新手,我对使用DCGAN架构来提供.npy文件非常感兴趣,并希望生成新的。npy文件。numpy文件的形状是(128,7752).

谁能帮我解剖一下DCGAN架构来解决这个问题?

在这一点上,它是非常理论化的。我知道这是可能的,我只是不知道如何改变DCGAN架构。

首先,.npy文件里面有什么?

虽然DCGAN是一个强大的架构,但它对图像数据特别有用。当然,您可以将任何2d数据视为图像,但结果可能令人失望。在您的示例中,即使.npy文件是图像,它们也可能太大,无法用普通的DCGAN生成。您将耗尽内存或只是有极差的结果。

众所周知,当涉及到大数据和巨大的多样性时,训练gan是相当具有挑战性的,这里有一篇文章回顾了训练gan的主要困难。

无论如何,如果你愿意尝试,以下是你应该遵循的主要步骤:

  1. 如果可能的话,将数据裁剪成更小的部分。在任何情况下,为了更容易地设计模型,数据的空间维度理想情况下应该是2的幂。
  2. 构建一个生成器,从随机的噪声块中输出正确大小的图像,例如,如果你的数据是128x4096,你可以构建一个具有足够的反卷积层的生成器,其步幅为128。然后你应该采样尺寸为1x32xC的噪声,其中C是通道数。
  3. 也建立一个判别器作为CNN,它可能不需要有相同的步幅。鉴别器将提供一个分类图,说明输入图像中的每个补丁是真还是假。
  4. 实现损耗和训练循环。

我希望这对你有帮助。

最新更新