一、生成对抗网络(GAN) 我们提出了一个通过对抗过程估计生成模型的新框架,在新框架中我们同时训练两个模型:一个用来捕获数据分布的生成模型G,和一个用来估计样本来自训练数据而不是G的概率的判别模型D,G的训练过程是最大化D产生错误的概率。这个框架相当于一个极小化极大的双方博弈。在任意函数G和D的空间中存在唯一的解,其中G恢复训练数据分布,并且D处处都等于1/2。在G和D由多层感知器定义的情况下,整个系统可以用反向传播进行训练。在训练或生成样本期间不需要任何马尔科夫链或展开的近似推理网络。 实验通过对生成的样品进行定性和定量评估来展示这个框架的潜力。1.1目标函数GAN的目标函数:从判别器D的角度,他希望自己可以尽可能的区分真是样本和虚假样本,因此希望D(x)尽可能的大,D(G(x)尽可能的小,即V(D,G)尽可能的大。从生成器的角度看,他希望自己尽可能的骗过D,也就是希望D(G(x)尽可能的大,即V(D,G)尽可能的小。两个模型相对抗,最后达到全局最优。图中,黑色曲线是真实样本的概率分布函数,绿色曲线是虚假样本的概率分布函数,蓝色曲线是判别器D的输出,