没有合适的资源?快使用搜索试试~ 我知道了~
人脸属性迁移的模型中,通过交换潜在编码实现多个面部属性传输
ELEGANT:与GAN交换潜在编码以传输多个面部属性TaihonggXiao[0000−0002−6953−7100],JiapengHongg,anddJinwenMa北京大学数学科学学院信息科学系,北京,100871jwma@math.pku.edu.cn抽象。近年来人脸属性迁移的研究取得了很大的成功。许多模型都能够通过输入图像传递人脸属性。然而,它们遭受三个限制:(1)不能通过样本生成图像;(2)不能同时传递多个面部属性;(3)生成的图像的低质量,诸如低分辨率或伪影。为了解决这些限制,我们提出了一种新的模型,它接收两个图像的相反属性的输入。我们的模型可以完全相同类型的属性从一个图像到另一个通过交换它们的编码的某些部分所有的属性编码在一个解开的方式在潜在的空间,这使我们能够同时操纵几个属性。此外,我们的模型学习残差图像,以便在更高分辨率的图像上进行训练。在对抗训练的多尺度鉴别器的帮助下,它甚至可以生成具有更精细细节和更少伪影的高质量图像。我们证明了我们的模型的有效性,克服上述三个限制,通过与其他方法的CelebA人脸数据库进行比较pytorch 实 现 可 在 https://github.com/Prinsphield/ELEGANT 上 获得。关键词:人脸属性转移,样本图像生成,属性解纠缠,生成式对抗网络1介绍传递人脸属性的任务是一种条件图像生成。修改源人脸图像以包含目标属性,同时应保留人的身份。如图所示的例子。1,刘海属性被操纵(添加或移除)而不改变人的身份。对于每一对图像,右图像纯粹从左图像生成,而没有训练集中的对应图像。已经提出了很多方法来完成这项任务,但它们仍然受到各种限制。Gardner等人[3]提出了一种称为Deep Manifold Traversal的方法,该方法能够近似自然图像流形并通过使用最大值通讯作者2肖泰宏,洪佳鹏,马锦文(a) 删除刘海(b)添加刘海图1:ELEGANT在转移刘海属性时的结果。在连续的四个图像中,第一个图像的刘海样式被转移到最后一个图像。平均差异(MMD)[6]。通过这种方法,属性向量是从VGG-19 [22]网络中提取的训练图像的特征表示的线性组合。然而,它遭受难以忍受的时间和存储器成本,因此在实践中是无用的。在线性特征空间假设[1]下,可以以更简单的方式[24]转移面部属性:在特征空间中将属性向量添加到原始图像,然后从计算的特征逆获得图像空间中的解。例如,传输无刘海图像将B映射到图像A将被分解为A=f−1(f(B)+vbanggs),其中f是从图像空间到特征空间的映射(通常是深度神经网络),并且属性向量vbangs可以被计算为有刘海图像和无刘海图像的特征的聚类中心通用属性向量适用于各种人脸,导致生成的人脸图像中具有相同风格的刘海但是刘海有很多种款式图1将是一个很好的说明不同风格的刘海。有些种类的刘海厚到足以覆盖整个前额,有些倾向于向左或向右,露出另一半前额,还有一些可能从中间分开,等等。优雅3(a) feminizing(b)男性化图2:ELEGANT在转移性别属性方面的结果为了解决多样性问题,Visual Analogy-Making [19]使用了一对参考图像来指定属性向量。这样的一对图像由同一个人的两个图像组成,其中一个具有某种属性,而另一个没有。这种方法可以增加生成图像的丰富性和多样性,但通常很难获得大量这样的成对图像。例如,如果将属性性别转移到人脸图像上,我们需要获得同一个人的男性和女性图像,这是不可能的。(See图(二)最近,越来越多的基于GANs [5]的方法被提出来克服这个困难[10,18,31]。人脸属性转换的任务可以看作是一种图像到图像的翻译问题。具有或不具有某个属性的图像位于不同的图像域。已经进一步利用双学习方法[7,11,21,28,32]来在源图像域和目标图像域之间进行映射。在循环一致性损失下,两个区域之间的映射是连续的,并且是彼此逆的根据域不变性定理1,两个图像域的固有维数应该相同。这导致矛盾,因为两个图像域的固有维度并不总是相同的。取下转移眼镜(图3)作为示例,域A包含佩戴眼睛的面部图像。1https://en.wikipedia.org/wiki/Invariance_of_domain4肖泰宏,洪佳鹏,马锦文(a) 移除眼镜(b)添加眼镜图3:ELEGANT在传递眼镜属性时的结果。在每一行中,第一图像中的眼镜类型被转移到最后一个。域B包含戴眼镜的面部图像,域B包含不戴眼镜的面部图像。由于眼镜的多样性,A的固有尺寸大于B一些其他方法[15,23,30]实际上是GAN和VAE组合的变体。这些模型采用自动编码器结构的图像生成,而不是使用两个映射互连两个图像域。他们成功地绕过了不相等的内在尺寸的问题然而,这些模型中的大多数仅限于每次仅操纵一个面部属性。为了同时控制多个属性,许多条件图像生成方法[2,13,18,29]接收图像标签作为条件。诚然,这些模型可以同时传递多个属性,但不能通过样本生成图像,即在另一幅参考图像中生成具有完全相同属性的图像。因此,生成的图像中的属性的风格可能是相似的,从而缺乏丰富性和多样性。BicycleGAN [33]引入了噪声项来增加多样性,但未能生成指定属性的图像。TD-GAN [25]和DNA-GAN [27]可以通过样本生成图像。但是TD-GAN需要在标签中提供显式的身份信息,以保持个人身份,这限制了它在许多没有标签身份信息的数据集上的应用。DNA-GAN在高分辨率图像上的训练困难也存在优雅5(a) 删除微笑(b)添加微笑图4:ELEGANT转移微笑属性的结果。在每一行中,第一个图像的微笑风格被移植到最后一个图像中。然而,许多其它方法[14],它们的结果在视觉上并不令人满意,在生成的图像中要么是低分辨率要么是大量伪像。2目的和直觉如上所述,有许多方法来转移面部属性。然而,它们中的大多数遭受以下一个或多个限制:1. 无法通过样本生成图像2. 无法同时转移多个人脸属性;3. 生成的图像质量低,例如分辨率低或伪影。为了克服这三个局限性,我们提出了一种新的模型集成了不同的优点,多个人脸属性转移。为了通过样本生成图像,模型必须接收用于条件图像生成的参考大多数先前的方法[2,13,17,18]直接使用标签来指导条件图像生成。但一个标签所提供的信息是非常有限的,这与该标签的图像多样性不相称各种类型的笑脸图像可以被分类为微笑,但是不能从相同的标签微笑反向生成所以我们设置了6肖泰宏,洪佳鹏,马锦文(a) black hair(黑色头发)图5:ELEGANT转移黑发属性的结果。在每一行中,除了将第三图像的颜色变为黑色之外,第一图像的颜色变为第三图像的颜色。作为图像编码的参考的图像的潜在编码可以被视为给定编码器的图像的唯一标识符。参考图像的编码被添加到输入,以便引导生成过程。以这种方式,所生成的图像将具有与参考图像中的属性完全相同的风格。为了同时操作多个属性,图像的潜在编码可以被划分为不同的部分,其中每个部分对单个属性的信息进行编码[27]。通过这种方式,多个属性被编码在不纠缠的态度。当传输多个特定的人脸属性时,应改变与这些属性相对应的编码部分。为了提高生成图像的质量,我们采用了残差学习[8,21]和多尺度鉴别器[26]的思想。人脸属性的局部性在人脸属性迁移任务中是唯一的,与人脸属性迁移任务相比图像风格转移[4],其中图像风格是整体属性。这种性质允许我们只修改图像的局部部分,以转移人脸属性,这有助于减轻训练难度。多尺度判别器可以捕获不同级别的信息,这些信息对于生成整体内容和局部细节都是有用的优雅73我们的方法在本节中,我们正式提出了我们的方法ELEGANT,即与GAN交换潜在编码以转移多个面部属性的缩写。3.1ELEGANT模型ELEGANT模型接收两组训练图像作为输入:正集和负集。在我们的约定中,来自正集合的图像A具有属性,而来自负集合的图像B没有。如图在图6中,图像A具有微笑属性,而图像B不具有。正集合和负集合不需要配对。(The来自正集合的人不需要与来自负集合的人相同所有n个传输属性都是预定义的。自然不能保证每个属性都被编码到不同的部分中。必须学习这种不纠缠的表现我们采用迭代训练策略:每次训练模型的一个特定的属性,喂养一对图像与相反的属性,并重复去所有的属性。当在该迭代中关于第i个属性微笑训练ELEGANT时,收集微笑图像的集合和非微笑图像的另一集合作为输入。形式上,要求A和B的属性标签都是这种形式YA=(yA,. . . 、11、. . . ,yA)和yB=(yB,. . . 、0、1、. . . ,yB)。1n1n然后使用编码器来获得图像A和B的潜在编码B,分别用zA和zBzA=Enc(A)=[al,. . . ,ai,. . . ,an],zB=Enc(B)=[bl,. . . ,bi,. . . ,bn](1)其中,ai(或bi)是图像A(或B)的图像形式的特征或编码。在实践中,我们将张量zA(或zB)连同其通道维度分成n个部分一旦获得zA和zB,我们就交换它们的潜在编码中的第i部分,以便获得新的编码zC和zD。zC=[a1,. . . ,bi,. . . ,an],zD=[b1,. . . ,ai,. . . ,bn](2)我们期望zC是图像A的非微笑版本的编码,并且zD是图像B的微笑版本的编码。如图在图6中,A和B都是彼此的参考图像,C和D是通过交换潜编码而生成的。然后我们需要设计一个合理的结构来破译潜在的编码成图像。如第2,它会更好地学习残差图像,而不是原始图像。因此,我们重新组合潜在的编码,并雇用一个解码器来做这项工作。Dec([zA,zA])=RA,A′=A+RADec([zC,zA])=RC,C=A+RC(三)Dec([zB,zB])=RB,B ′=B+RBDec([zD,zB])=RD,D=B+RD(四)8肖泰宏,洪佳鹏,马锦文编码器解码器1……潜在编码交换添加Æ1 …C1Æ′1 …B1 …DC[?,?]1[C,?]1 ……[B,B]1[D,B]1 ...nB′D图6:ELEGANT模型架构。其中RA、RB、RC和RD是独立图像,A′和B ′是结构化图像,C和D是新属性的图像,[zC,zA]表示编码zC和zA的级联。连接可以用两个编码的差来代替,但我们仍然使用连接的形式,因为减法运算可以通过Dec学习。此外,我们使用U-Net[20]结构以获得更好的视觉效果。Enc和Dec的结构是对称的,它们的中间层通过快捷方式连接,如图所示。六、这些快捷方式将原始图像作为上下文条件,从而生成无缝的小说属性。Enc和Dec一起充当发电机。我们还需要用于对抗训练的判别器。然而,当输入图像尺寸变大时,单个鉴别器的感受野是有限的。为了解决这个问题,我们采用多尺度鉴别器[26]:两个鉴别器具有相同的网络结构,但在不同的图像尺度下操作。我们用D1表示在较大规模下操作的识别器,用D2表示另一个识别器。D1的感受野比D2小。因此,D1擅长引导Enc和Dec产生更精细的细节,而D2擅长处理整体图像内容,以避免产生鬼脸。鉴别器还应当接收图像标签作为条件输入。总共有n个属性。鉴别器在每次迭代中的输出反映了所生成的图像相对于一个属性的真实程度有必要让鉴别器知道它们在每次迭代中处理的是哪个属性。从数学上讲,这是一种条件形式。例如,D1(A|YA)通过D1为图像A提供 可用 的YA复制输出。We优雅9应该注意C和D的属性标签,因为它们具有新的属性。YA=(yA,. . . 、11、. . . ,yA)yB=(yB,. . . 、0、1、. . . ,yB)(5)1n1nYC=(yA,. . . 、0、1、. . . ,yA)Y D=(yB,. . . 、11、. . . ,yB)(6)1n1n其中YC与YA的区别仅在于第i个元素,用0替换1,因为我们不期望C具有第i个属性。这同样适用于YD和Y B。3.2损失函数多尺度鉴别器D1和D2接收标准对抗损失LD1=−E(lo g(D1(A|YA)−E(lo g(1−D1(C|Y(C)(七)-E(log(D(B|Y B)− E(log(1 − D(D|Y D)))1 1LD2=−E(lo g(D2(A|YA)))−E(lo g(1−D2(C|Y(C)-E(log(D(B|Y B)− E(log(1 − D(D|(8)2 2LD=LD1+LD2(9)当最小化Ld时,我们实际上是最大化真实图像的分数,同时最小化假图像的分数。这驱使D1和D2将假图像与真实图像区分开。至于Enc和Dec,有两种类型的损失。第一种类型是重建损失,Lreeconst ruction= ||A−A′|| + ||B−B ′||(十)其测量在编码和解码序列之后原始输入被重构得有多好。第二种是标准对抗性损失Ladv=−E(lo g(D1(C|YC)−E(lo g(D1(D|YD)))(十一)-E(log(D(C|YC)−E(log(D(D|Y D)))2 2其测量所生成的图像的真实程度。发电机的总损耗为L G = L重建+L adv.(十二)4实验在本节中,我们进行不同类型的实验来验证我们的方法在克服三个限制方面的有效性首先,我们详细介绍了数据集和我们的模型CelebA [16]数据集是一个大规模的人脸数据库,包括10177个身份的202599张人脸图像,每张图像有40个属性注释和5个地标10肖泰宏,洪佳鹏,马锦文||2||2图7:不同刘海的插值结果。左上角是原始的,其他三个角是不同风格刘海的参考图像。中间的其余16幅图像是插值结果。地点我们使用5点界标对齐所有人脸图像,并将其裁剪为256× 256。所有以下实验均在此规模下进行编码器配备有5层Conv-Norm-LeakyReLU块,并且解码器具有5层Deconv-Norm-LeakyReLU 块 。 多 尺 度 判 别 器 使 用 5 层 Conv-Norm-LeakyReLU块,然后是完全连接的层。 所有网络都使用Adam [12]进行训练,初始化学习速率为2 e-4,β1 = 0。5和β2 = 0。999.所有输入图像被归一化到范围[-1,1]中,并且解码器的最后一层使用2·tanh被裁剪到范围[-2,2]中,因为输入图像和输出图像之间的最大差是2。在将残差添加到输入图像之后,我们将输出图像值裁剪为[-1,1]以避免超出范围的错误。值得一提的是,应避免使用批量归一化(BN)层。ELEGANT接收两批具有相反属性的图像作为输入,因此每层中两批图像的移动均值和移动方差应该有很大的差异。如果使用BN,则每层中的这些运行统计为了克服这个问题,我们用2-normalization,x=x·α+β代替BN,其中α和β是可比较的。在不计算移动统计量的情况下,ELEGANT稳定地收敛并有效地交换面部属性。4.1基于样本的为了证明我们的模型可以通过样本生成人脸图像,我们选择UNIT[15],CycleGAN [32]和StarGAN [2]进行比较。 如图8、ELEGANT可以在参考图像中生成具有完全相同属性风格的不同人脸图像,而其他方法只能在参考图像中生成具有完全相同属性风格的不同人脸图像。优雅11输入ELEGANT UNIT CycleGAN StarGAN(a) 刘海输入ELEGANT UNIT CycleGAN StarGAN(b) 微笑图8:通过样本的面部图像生成。黄色和绿色框分别是训练数据和参考图像之外的输入图像。红色和蓝色框中的图像是ELEGANT和其他模型的结果。12肖泰宏,洪佳鹏,马锦文为任何输入图像生成通用样式的属性。(The蓝色框中的每一列中的刘海样式相同。)这里应该指出StarGAN的一个重要缺点。StarGAN可以被训练成传输多个属性,但是当只传输某个属性时,它可能会改变其他属性。例如,在图1的8(a),Fei-Fei Li和Andrew Ng在添加刘海时变得更年轻这是因为StarGAN需要输入图像的明确标签,并且这两个图像都在属性young中被标记为1。不过,两人都是中年人,不能简单地贴上年轻或年老的标签。在ELEGANT模型中交换潜在编码的机制有效地解决了这个问题。ELEGANT专注于我们正在处理的属性,并且在测试阶段不需要输入图像的标签。此外,ELEGANT可以学习参考图像中不同刘海风格之间的细微差异7 .第一次会议。4.2同时处理多个属性我们将ELEGANT与DNA-GAN [27]进行比较,因为它们都能够操作多个面部属性并通过样本生成图像。针对三个属性对相同的人脸图像和参考图像执行两个模型如图9,ELEGANT在视觉上比DNA-GAN好得多,特别是在产生更精细的细节(放大以更仔细地观察)方面。与DNA-GAN相比,改进主要是残差学习和多尺度鉴别器的结果。剩余学习降低了训练难度。DNA-GAN遭受不稳定的训练,特别是在高分辨率图像上。一方面,这个困难来自于发生器和鉴别器之间的不平衡。在DNA-GAN训练的早期阶段,生成器输出无意义的内容,以便鉴别器可以轻松地学习如何将生成的图像与真实图像区分开来,这将很快打破平衡。然而,ELEGANT采用了残差学习的思想,因此在早期阶段,生成器的输出几乎与原始图像相同。以这种方式,鉴别器不能如此快地被很好地训练,这将有助于稳定训练过程。另一方面,随着图像尺寸变大,生成器的负担变得比鉴别器的负担更重。因为发生器的输出空间变大(例如,256×256×3),而鉴别器只需要像往常一样输出一个数字。然而,ELEGANT有效地通过学习残差图像来减少通用计算机的输出的尺寸,其中需要修改少量的像素。多尺度鉴别器提高了生成图像的质量一个discriminator操作在较小的输入规模,可以引导整体图像内容的生成,而其他操作在较大的输入规模,可以帮助生成器产生更精细的细节。(已在第二节中讨论。3.第三章。第一章此外,DNA-GAN利用附加部分来编码面部id和背景信息。这是一个好主意,但带来了琐碎的解决方案的问题优雅13优雅的DNA基因(a) 刘海和微笑(b) 微笑和胡子(c) 刘海和胡子图9:多属性插值。左列和右列分别是ELEGANT和DNA-GAN的结果对于每个图片,左上、左下和右上图像是原始图像、第一和第二属性的参考图像原始图像在两个方向上逐渐拥有参考图像的两种不同可以直接交换两个输入图像以满足损失约束。Xiao等[27]提出了所谓的湮灭操作来解决这个问题。但是这种操作导致了参数空间的失真,这给训练带来了额外的困难。ELEGANT学习说明变化的残差图像,使得面部ID和背景信息被14肖泰宏,洪佳鹏,马锦文表1:关于五种属性的不同方法的FID。+(−)表示通过添加(删除)属性生成的图像。FID刘海微笑胡子眼镜男性+−+−+−+−+−单元135.41 137.94 120.25 125.04 119.32 131.33 111.49 139.43 152.16 154.59CycleGAN 27.8133.22 23.23 22.74 43.5855.49 36.87 48.8260.25 46.25StarGAN59.6871.0751.3678.8799.03 176.1870.40 142.3570.14 206.21公司简介79.2776.8977.0472.35 126.33 127.6675.0275.96 121.04 118.67优雅30.71 31.1225.7124.88 37.51 49.1347.3560.71 59.37 56.80自动保存。此外,它删除了零化操作和潜在编码中的附加部分,这使得整个框架更加优雅和易于理解。4.3生成的高质量图像如图所示 1 2 3 4 5中,我们给出了ELEGANT关于闭合块在大尺寸上的差异的结果。此外,我们使用Fr´echetInception Distance [9](FID)来衡量生成图像的质量。FID测量两个分布的距离,d2=||µ1−µ2||2+Tr(C1+C2−2(C1C2)1/2)。(十三)其中(µ1,C1)和(µ2,C2)是两个分布的均值和协方差矩阵。如表1所示,我们计算真实图像和生成图像的分布之间关于不同属性的FID与其他方法相比,ELEGANT取得了有竞争力的结果。FID评分仅供参考,原因有二。ELEGANT和DNA-GAN可以通过范例生成图像,这比其他类型的图像翻译方法更通用因此,使用任何定性措施对他们仍然是不公平的。此外,GAN的合理定性措施尚未确定。5结论我们已经建立了一个新的模型ELEGANT多人脸属性的传输。该模型将不同的属性编码成解开的部分,并通过交换潜在编码的某些部分来生成具有新属性的图像。在观察到只需要修改图像的局部来传递人脸属性的情况下,我们采用残差学习来促进高分辨率图像的U-Net结构设计和多尺度判别器进一步提高了图像质量。在CelebA人脸数据库上的实验结果表明,ELEGANT算法成功地克服了其他方法存在的三个常见缺陷。谢谢。本工作得到了北京大学高性能计算平台的支持。书目[1] Bengio,Y.,Mesnil,G.,Dauphin,Y. Rifai,S.:通过深度代表更好地 混 合 。 国 际 机 器 学 习 会 议 ( International Conference on MachineLearning)pp.第552[2] 崔 , Y. , Choi , M. , Kim , M. , J.W. Kim , S. , Choo , J. :Stargan:用于多域图像到图像翻译的统一生成对抗网络IEEE计算机视觉与模式识别会议(CVPR)(2018)[3] Gardner,J.R.,Upchurch,P. Kusner,M.J.,李,Y.,Weinberger,K.Q.,Bala,K.,Hopcroft,J.E.:深度流形遍历:使用卷积特征更改标签。arXiv预印本arXiv:1511.06421(2015)[4] 洛杉矶的加蒂斯Ecker,A.S. Bethge,M.:艺术风格的神经算法。自然通讯(2015)[5] 古德费洛岛Pouget-Abadie,J. Mirza,M.,徐,B.,沃德-法利,D.,Ozair,S.,Courville,A. Bengio,Y.:生成性对抗网。在:先进的神经信息处理系统。pp. 2672[6] Gretton,A. ,B或g wardt,K. M., R为ch,M. J. Schoülkopf,B.,Smola,A. :核双样本检验。Journal of Machine Learning Research 13(Mar),723[7] 他D夏,Y.,Qin,T.,Wang,L.,美国,Yu,N.,Liu,T.,马伟英:机器翻译的双重学习。在:神经信息处理系统的进展。pp. 820[8] 他,K.,张,X.,Ren,S.,孙杰:用于图像识别的深度残差学习。在:IEEE计算机视觉和模式识别会议论文集。pp. 770[9] Heusel,M.,Ramsauer,H. Unterthiner,T.,内斯勒湾Hochreiter,S.:两个时间尺度更新规则训练的甘斯收敛到一个局部纳什均衡。在:神经信息处理系统的进展。pp. 6629[10] Isola,P.,Zhu,J.Y.,周,T.,Efros,A.A.:使用条件对抗网络的图像到图像翻译ArXiv预印本(2017)[11] 金,T.,Cha,M.,Kim,H. Lee,J.K.,Kim,J.:学习用生成对抗网络发现跨域关系In:Preup,D.,TehY. W.(编辑)第34届机器学习国际会议论文集。《机器学习研究》,卷。第70页。1857- 1865年。PMLR,国际会议中心,悉尼,澳大利亚(2017年8月6日http://proceedings.mlr.press/v70/kim17a.html[12] 金玛,D.P.,Ba,J.L.:Adam:随机最佳化的方法。国际学习表征会议(2015)[13] Lample,G. Zeghidour,N.,Usunier,N.,Bordes,A.,德诺耶,L.,等:推子网络:通过滑动属性操纵图像在:神经信息处理系统的进展pp. 596316肖泰宏,洪佳鹏,马锦文[14] Li,M.,左,W.,张德:面部属性的深度身份感知转移arXiv预印本arXiv:1610.05586(2016)[15] Liu,M.Y. Breuel,T.,Kautz,J.:无监督图像到图像翻译网络。在:神经信息处理系统的进展。pp. 700[16] 刘志,Luo,P.,王,X., 唐X: 在野外深度学习人脸属性。计算机视觉国际会议(ICCV)(2015)[17] 吕,Y.,Tai Y.W. Tang,C.K.:属性引导的条件循环人脸图像生成arXiv预印本arXiv:1705.09966(2017)[18] Perarnau,G., 和Weijer,J., Raduca nu,B. 我们走吧J。M. :Ivertible用于图像编辑的条件GANarXiv预印本arXiv:1611.06355(2016)[19] Reed,S.E.,张玉,张玉,Lee,H.:深度视觉类比。在:神经信息处理系统的进展。pp. 1252[20] Ronneberger,O.,Fischer,P.,Brox,T.:U-网:用于生物医学图像分割的卷积网络。在:医学图像计算和计算机辅助干预国际会议。pp. 234-241 第10集9.5分[21] Shen,W.,Liu,R.:学习人脸属性操作的残差图像。IEEE计算机视觉与模式识别会议(CVPR)pp. 1225-1233. IEEE(2017)[22] 西蒙尼扬,K.,齐瑟曼,A.:用于大规模图像识别的极深卷积网络。国际学习代表会议(2015)[23] Taigman,Y.,Polyak,A.,沃尔夫湖:无监督跨域图像生成。arXiv预印本arXiv:1611.02200(2016)[24] Upchurch , P. 加 德 纳 , J 。 , Bala , K. , 普 利 斯 河 Snavely , N.Weinberger,K.Q.:针对图像内容变化的深度特征插值。arXiv预印本arXiv:1611.05507(2016)[25] Wang,C.,中国地质大学,Wang,C.,中国地质大学,徐,C.,Tao,D.:用于目标图像重绘制的标签解缠生成第26届国际人工智能联合会议论文集. pp. 2901[26] Wang T.C. Liu,M.Y. Zhu,J.Y.,Tao,A.,Kautz,J.,Catanzaro,B.:高分辨率图像合成和语义操作与条件GAN。IEEE计算机视觉与模式识别会议(CVPR)(2018)[27] Xiao,T.,Hong,J.,Ma,J.:Dna-gan:从多属性图像中学习解纠缠表示。学习代表国际会议,研讨会(2018)[28] Yi,Z.,张洪,Tan,P.,龚,M.:Dualgan:图像到图像翻译的无监督双重在:IEEE计算机视觉国际会议(ICCV)(2017年10月)[29] Zhao,B.,Chang,B.,杰,Z. Sigal,L.:模块化生成对抗网络。arXiv预印本arXiv:1804.03343(2018)优雅17[30] Zhou,S.,Xiao,T.,杨,Y.,Feng,D.,他,Q.,He,W.:Genegan:学习- ING对象变形和属性子空间从不成对的数据。In : ProceedingsoftheBritishMachineVisionConference(BMVC)(2017),http://arxiv.org/abs/1705.04932[31] Zu,J. Y. ,Kra¨henb u¨hl,P., Se chtman,E., Efros,A.A. :在自然图像流形上进行几何视觉操作。欧洲计算机视觉会议。pp. 597-613. Springer(2016)[32] Zhu,J.Y.,Park,T. Isola,P.,Efros,A.A.:使用循环一致对抗网络 的 不 成 对 图 像 到 图 像 翻 译 。 国 际 计 算 机 视 觉 会 议 论 文 集(ICCV)(2017)[33] Zhu,J.Y.,张,R. Pathak,D.,Darrell,T.,埃夫罗斯,匿名戒酒会Wang,O.,Shecht-man,E.:走向多模态图像到图像翻译。在:神经信息处理系统的进展。pp. 465
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++多态实现机制详解:虚函数与早期绑定
- Java多线程与异常处理详解
- 校园导游系统:无向图实现最短路径探索
- SQL2005彻底删除指南:避免重装失败
- GTD时间管理法:提升效率与组织生活的关键
- Python进制转换全攻略:从10进制到16进制
- 商丘物流业区位优势探究:发展战略与机遇
- C语言实训:简单计算器程序设计
- Oracle SQL命令大全:用户管理、权限操作与查询
- Struts2配置详解与示例
- C#编程规范与最佳实践
- C语言面试常见问题解析
- 超声波测距技术详解:电路与程序设计
- 反激开关电源设计:UC3844与TL431优化稳压
- Cisco路由器配置全攻略
- SQLServer 2005 CTE递归教程:创建员工层级结构
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功