图像卡通化方法的研究和应用

62 浏览量更新于2023-10-25 收藏 3.45MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

1使用白盒卡通表示王欣瑞1、2、3余金泽21字节跳动2东京大学3Style2Paints研究(a)动画“文字花园”中的一帧图1：真实卡通图像和通过我们的方法处理的图像之间的比较。摘要本文提出了一种图像卡通化的方法。By observingthe cartoon painting behavior and consulting artists, weproposetoseparatelyidentifythreewhite-boxrepresentations from images: the surface rep- resentationthat contains a smooth surface of cartoon im- ages, thestructure representation that refers to the sparse color-blocks and flatten global content in the celluloid styleworkflow, and the texture representation that reflects high-frequency texture, contours, and details in cartoon im-ages. 生成对抗网络（GAN）框架用于学习提取的表示和自动化图像。我们的方法的学习目标是分别基于每个提取的表示，使我们的框架可控和可调。这使我们的方法能够满足艺术家在不同风格和不同用例中的需求。定性比较和定量分析以及用户研究都验证了该方法的有效性，在所有比较中，我们的方法都优于以前的方法。最后，消融研究表明，在我们的框架中的每个组件的影响。1. 介绍卡通是一种流行的艺术形式，在不同的场景中得到了广泛的应用。现代卡通动画的工作流程允许艺术家使用各种资源来创造内容。一些著名的产品是通过将真实世界的摄影变成可用的卡通场景材料而创造出来的，这个过程叫做图像卡通化。卡通风格和用例的多样性需要特定于任务的假设或先验知识来开发可用的算法。例如，一些卡通工作流程更关注全局调色板主题，但线条的清晰度在其他一些工作流程中，稀疏和干净的色块在艺术表现中起主导作用，但主题相对不那么受重视。这些变体对黑盒模型提出了重大挑战，[20，48，6]，当面对艺术家在不同用例中的不同需求时，简单地改变训练数据集并没有帮助。特别是CartoonGAN [6]是为图像卡通化而设计的，其中提出了一种具有新边缘损失的GAN框架，并在某些情况下取得了但使用黑箱模型直接拟合训练数据降低了其通用性和风格化质量，在某些情况下会导致不良情况。针对上述问题，我们对人类的绘画行为和不同风格的卡通形象进行了根据我们的观察，如图3所示，我们建议将图像分解为几个卡通表示，并将它们列出如下：首先，我们提取表面表示来表示图像的光滑表面。给定一幅图像I∈RW×H ×3，我们提取一个加权的低频分量Isf∈RW×H ×3，其中颜色组成和表面纹理被保留，边缘，纹理和细节ig。诺瑞德这个设计的灵感来自于卡通画-80908091表面表示结构表示真实世界的照片卡通参考纹理表示卡通化结果：分解：学习图3：卡通形象的共同特征：1.由稀疏色块组成的全局结构; 2.由锐利和清晰的边缘勾勒出的细节;3.平坦光滑的表面。图2：我们的方法的简单说明。图像分解成三个卡通表示，指导网络优化生成卡通化照片。艺术家通常在细节修饰之前绘制构图草稿其次，提出了结构表示法，有效地抓住了全局结构信息和赛璐珞卡通风格中的稀疏色块我们提取一个隔离区-从输入图像I∈RW×H ×3和然后在每个分段上应用自适应着色算法分割区域生成结构表示Ist∈RW×H ×3。这种表示法的动机是模仿赛璐珞卡通风格，其特点是边界清晰，色块稀疏。结构表示对于生成稀疏表示具有重要意义视觉效果，以及为我们的方法被嵌入在赛璐珞风格的卡通工作流程。第三，我们使用纹理表示来包含画的细节和边缘。输入图像I∈RW×H ×3为• 根据我们对卡通绘画行为的观察，我们提出了三种卡通表示：表面表示、结构表示和纹理表示。然后引入图像处理模块来提取每个表示。• 在提取表征的指导下，优化了基于GAN的图像卡通化框架。用户可以通过平衡每个表示的权重来调整模型输出的样式• 大量的实验表明，我们的方法可以生成高质量的卡通图像。我们的方法优于现有的方法在定性比较，定量比较，和用户的喜好。2. 相关工作2.1. 图像平滑与曲面提取图像平滑[37，14，10，29，5]是一个广泛研究的主题。早期的方法主要是基于过滤的[37，转换为单通道强度图It∈RW×H ×1，14]和优化为基础的方法后来变得流行。Farbman等人[10]利用加权最小二乘法，其中颜色和亮度被去除并且相对保持像素强度。这种特征表示的动机是卡通绘画方法，艺术家首先画一个线条草图的轮廓和细节，然后应用颜色。它引导网络独立地学习高频纹理细节，排除颜色和亮度模式单独提取的卡通表示使得卡通化问题能够在生成神经网络（GAN）框架内端到端地优化，使其对于实际用例可扩展和可控，并且易于通过任务特定的微调来满足多样化的艺术需求。我们测试我们的方法对各种现实世界的照片在不同的场景在不同的风格。实验结果表明，该方法可以生成色彩和谐、艺术风格优美、边界清晰、伪影明显减少的图像。我们还表明，我们的方法优于以前的国家的最先进的方法，通过定性实验，定量实验，和用户研究。最后，进行烧蚀研究，以说明每个代表的影响。最后，我们的贡献如下：应变边缘保持算子，Minet al. [29]通过最小化二次能量函数解决了全局图像平滑，Bi等人。[5]提出了一种用于图像平滑和平坦化问题的L1变换。Xu和Fan等人[44，9]引入了用于图像平滑的端到端网络在这项工作中，我们采用了可微引导滤波器[42]来从图像中提取平滑的卡通状表面，使我们的模型能够学习艺术家在卡通艺术作品中创建的结构级合成和平滑表面。2.2. 超像素与结构提取超像素分割[11，31，30，2]将图像中具有相似颜色或灰度级的空间连接像素分组。一些流行的超像素算法[11，31，30]是基于图的，将像素视为节点，将像素之间的相似性基于梯度上升的算法[7，40，2]使用粗糙聚类初始化图像，并使用梯度上升迭代优化聚类，直至收敛。在这项工作中，我们遵循felzenszwalb算法[11]来开发一种面向卡通的分割方法，以实现可学习的结构表示。这8092表面表示模型体系结构引导过滤结构表征网站地图VGG16中国电视网结构表征超像素选择性搜索纹理表示随机色移输入发生器：可训练卷积层：预先训练的卷积层：非网络模块输出卡通形象纹理表示所述表面表示热织构曲面热织构曲面图4：我们提出的图像卡通化系统表示对于深度模型捕捉全局内容信息并产生用于赛璐珞风格卡通工作流的实际可用的结果是重要的2.3. 非真实感渲染非真实感渲染（NPR）方法表示具有艺术风格的图像内容，例如铅笔素描[43，28]，油漆[12，20]，水彩[39]。图像自动化也被广泛研究，从基于过滤的方法[34]到端到端神经网络[6]，涵盖照片[6]，视频[41]和肖像[45]的用例。神经风格转移方法[12，20，8，16]是NPR算法中的流行方法，它通过结合一个图像的内容和另一个图像的风格来合成具有艺术风格的Gatys等人[12]联合优化了样式损失和内容损失，以生成具有样式-内容图像对的样式图像。Johnson等人[20]通过训练具有感知损失的端到端网络来加速风格化一些作品[8，16]后来提出了不同的方法来处理图像。NPR方法也广泛用于图像抽象[24，21]。这些方法突出语义边缘，同时过滤掉图像细节，呈现原始图像的抽象视觉信息，并且通常用于卡通相关应用。我们的方法，不同的风格转移方法，使用一个单一的图像作为参考或图像抽象方法，简单地考虑内容图像，学习卡通数据分布从一组卡通图像。这使得我们的模型可以在不同的用例中合成高质量的卡通图像。2.4. 生成对抗网络生成对抗网络（GAN）[13]是一种最先进的生成模型，可以通过求解最小-最大概率来生成具有相同输入数据分布的数据。发电机网络和发电机网络之间的关系。它在图像合成中具有很强的功能，可以使生成的图像与真实图像难以区分GAN已广泛用于条件图像生成任务，例如图像修复[32]，风格转移[33]，图像汽车化[6]，图像着色[46]。在该方法中，我们采用对抗训练结构，并使用两个判别器来强制生成器网络合成与目标域分布相同的图像。2.5. 图像到图像翻译图像到图像转换[19，17，25，48]解决了将图像从源域转换到另一个目标域的问题。其应用包括图像质量增强[18]，将照片风格化为颜料[20，33]，卡通图像[6]和草图[26]，以及灰度照片着色[47]和草图着色[46]。最近，双向模型也被引入域间翻译。Zhu等 [48]执行未配对图像的变换（即，夏天到冬天，照片到油漆）。在本文中，我们采用一个不成对的图像到图像的翻译框架的图像卡通化。与以前的黑盒模型不同，我们将图像分解为几个表示，这迫使网络学习具有不同目标的不同特征，使学习过程持续进行。trollable可控and tunable调谐.3. 该方法我们在图4中展示了我们提出的图像卡通化框架。将图像分解为表面表示、结构表示和纹理表示，并引入三个独立的模块提取相应的一种具有一个生成器G和两个鉴别器Ds和Dt的布雷德格夫阿尔布尔奇普罗斯特8093公司简介2其中Ds用于区分从模型输出中提取的表面表示和卡通，Dt用于区分从输出中提取的纹理表示和卡通。预训练的VGG网络[35]用于提取高级特征，并对提取的结构表示和输出之间以及输入照片和输出之间的全局内容施加空间约束。每个组件的权重可以在损失函数中调整，这允许用户控制输出样式并使模型适应不同的用例。(c) 平均颜色(d) 使用自适应颜色的3.1. 从表面表示学习表面表示模仿卡通绘画风格，其中艺术家用粗糙的画笔粗略地绘制草稿，并具有类似于卡通图像的光滑表面。平滑图像，同时保持全局语义结构，采用可微引导滤波器进行边缘保持滤波。表示为Fdgf，它将图像I作为输入并且其自身作为引导图，返回去除了纹理和细节的提取的表面表示Fdgf（I，I）引入了一个判别模型输出和参考卡通图像具有相似的表面，并引导生成器G学习存储在提取的表面表示中的信息。令Ip表示输入照片并且Ic表示参考卡通图像，我们将表面损失公式化为：Lsurface（G，Ds）=logDs（Fdgf（Ic，Ic））+log（1−D（F（G（I），G（I）（1）3.2. 从结构表征中结构表示法模拟了celluloid风格卡通工作流程中的扁平化全局内容、稀疏色块和清晰边界。我们首先使用felzenszwalb算法分割图像到单独的区域。由于超像素算法只考虑像素的相似性而忽略语义信息，我们进一步引入选择性搜索[38]来合并分割区域并提取稀疏分割图。标准的超像素算法用像素值的平均值对每个分割通过分析处理后的数据集，我们发现这会降低全局对比度，使图像变暗，并对最终结果产生模糊效应（如图5所示）。因此，我们提出了一个自适应着色算法，并将其公式化为等式2，其中我们发现γ1= 20，γ2 = 40和μ= 1。2产生良好的效果。彩色分割图和训练的最终结果自适应着色如图5所示，这有效地增强了图像的对比度并减少了模糊效应。图5：自适应着色算法。(a)和（b）示出了具有不同着色方法的分割图，而(c)以及（d）示出了用不同着色方法产生的结果。自适应着色生成更明亮且无模糊效果的结果。我们使用预训练的VGG16网络[35]提取的高级特征来加强我们的结果和提取的结构表示之间的空间约束令Fst表示结构表示提取，结构损失L结构被公式化为：L结构=<$VGGn（G（Ip））−VGGn（Fst（G（Ip）<$（3）3.3. 从纹理表示学习卡通图像的高频特征是关键的学习目标，但是亮度和颜色信息使得卡通图像和真实世界的照片因此，我们提出了一种随机色移算法Frcs，用于从彩色图像中提取单通道纹理表示，该算法保留了高频纹理，降低了颜色和亮度的影响Frcs（Irgb）=（1−α）（β1Ir+β2Ig+β3Ib）+αY（4）在等式4中，Irgb表示3通道RGB彩色图像，Ir、Ig和Ib表示三个彩色通道，Y表示从RGB彩色图像转换的标准灰度图像。我们设置α= 0。8，β1，β2和β3<$U（−1，1）。如图4所示，随机色移可以生成去除了亮度和颜色信息的随机强度图。引入了一个可识别的纹理生成器t来区分从模型输出和动画中提取的纹理表示，并引导生成器学习纹理表示中存储的清晰L纹理（G， Dt）=logDt（ Frcs（Ic））+log（1−D（F （G（I）（5）Si，j=（θ1<$S<$+θ2<$S<$）µ（2）3.4. 完整模型测试rcs pσ（0，1）σ（S）γ1，（θ1，θ2）=（0. 5，0。5）γ1<σ（S）<γ2，（1，0）γ < σ（S）。我们的完整模型是一个基于GAN的框架，具有一个生成器和两个鉴别器。它与从三个卡通表示中学习的特征联合优化，(a)平均颜色分割（b）自适应颜色8094方法[20个][6]美国[48个]我们LR，CPU（ms）639.311947.971332.6664.66LR，GPU（ms）16.5313.769.223.58HR，GPU（ms）48.96148.02106.8217.23参数（M）1.6811.3811.131.48表1：性能和型号尺寸比较，LR表示256*256分辨率，HR表示720*1280分辨率图6：细节的清晰度可以通过风格插值来调整从左到右δ可以用公式6表示。通过调整和平衡λ1、λ2、λ3和λ4，可以很容易地适应不同艺术风格的各种应用。优化两个网络。在训练期间，学习率和批量大小被设置为2×10−4和16我们首先用50000次迭代的内容丢失对生成器进行预训练，然后联合优化基于GAN的框架。训练在100000次迭代或收敛后停止。本文所给出的所有结果，除特别提及外，都是在λ1= 1，λ2= 10，λ3= 2<$103，λ4= 2<$103，λ5=104时产生的.该设置基于训练数据集的统计数据作为我们的方法是数据驱动的，神经网络可以自适应学习的视觉构成，即使参数是粗略定义的。Ltotal=λ1<$L表面+λ 2<$L纹理+λ3μL结构+λ 4μL含量+λ 5μLtv（六）数据集。人脸和景观数据的收集，用于在不同的场景泛化对于真实世界的照片，总变差损失Ltv[4]用于对生成的图像施加空间平滑度。它还减少了高频噪声，如椒盐噪声。等式图7中，H、W、C表示图像的空间维度我们从FFHQ数据集中收集了10000张图像[22]，人脸和5000张来自[48]中的风景数据集的图像。对于卡通图像，我们收集了10000张人脸动画图像和10000张风景图像。收集动画的制作者包括京都1L= 1000（G（I））+（G（I））（7）动画、P.A.Works、新海诚、细田守、tvHWCx p y p使用内容损失L内容来确保卡通化结果和输入照片在语义上不变，L 1范数的稀疏性允许局部特征被卡通化。与结构损失类似，其计算方法为预训练的VGG16特征空间：L含量=<$VGGn（G（Ip））−VGGn（Ip）<$（8）为了调整输出的锐度，我们采用了一个可微引导滤波器Fdgf进行风格插值。如图6所示，它可以有效地调整细节和边缘的清晰度，而无需微调网络参数。将网络输入表示为Iin，将网络输出表示为Iout，我们将后处理公式化为等式9，其中Iin用作引导图：宫崎骏对于验证集，我们收集了3011张动画图像和1978张真实照片。主论文中显示的图像收集自DIV2K数据集 [3] ，用户研究中的图像收集自互联网和Microsoft COCO [27]数据集。在训练过程中，所有图像的大小都调整为256*256分辨率，并且每五次迭代中只输入一次面部图像。以前的方法。我们将我们的方法与分别代表神经风格转换[20]，图像到图像转换[48]，图像抽象[21]和图像卡通化[6]的评估指标。在定性实验中，我们提出了四种不同的方法和原始图像的细节，以及定性分析的结果。在定量实验中，我们使用Frechet起始距离（FID）。[15]通过计算距离来评估性能Iinterp =δFdgf（我在，G（Iin））+（1−δ）<$G（Iin）（9）在源图像分布和目标图像分布之间。在用户研究中，要求候选人对80954. 实验结果4.1. 实验装置实施. 我们使用TensorFlow [1]实现我们的GAN方法。补充材料中描述了发生器和系统架构。为了简化计算和提高判别能力，采用了分片插值法[19]我们使用Adam [23]算法1 ~ 5级不同方法对动画质量和整体质量的影响。分数越高意味着质量越好。时间性能和模型大小。四种方法的速度在不同的硬件上进行了比较，如表1所示。我们的模型是所有设备和所有分辨率上四种方法中最快的，并且具有最小的模型尺寸。该模型在GPU上处理一幅720*1280图像的时间仅为17.23ms，具有较好的实时性8096(a) 人（b）动物（c）植物（d）食物(e)城市景观（f）风景图7：我们的方法在不同场景中的结果。放大查看详细信息号表面结构纹理原始ACC0的情况。82010.63420.83840.9481FID113.57112.86112.71162.89表2：我们提出的卡通表示的分类准确性和FID评估。(a) 输入照片(b) 多个纹理(c)更多的结构(d)多个表面怨恨我们发现提取的表示成功地欺骗了训练过的分类器，因为与图8：输出质量可以通过调整每个代表的重量。放大查看详细信息。高分辨率视频处理任务。对不同用例的通用性。我们将我们的模型应用于不同的现实世界场景，包括自然景观，城市景观，人，动物和植物，并在图7中显示结果。补充材料中显示了不同风格和不同用例的更多示例4.2. 卡通表示的验证为了验证我们提出的卡通表示的合理性和有效性，我们进行了基于FID的分类实验和定量实验，结果如表2所示。我们在训练数据集上训练了一个二元分类器，以区分真实世界的照片和卡通图像。分类器的设计是通过在我们的框架中添加一个完全连接的层来实现的。然后在验证集上评估训练的分类器，以验证每个卡通代表的影响。原始图像。计算出的FID指标也支持我们的建议，卡通表示帮助缩小现实世界的照片和卡通图像之间的差距，因为所有三个提取的卡通表示具有较小的FIDCOM，原始图像。4.3. 可控性说明如图8所示，卡通化结果的风格可以通过调整损失函数中每个表示的权重来调整。增加纹理表示的权重增加了图像中更多的细节，丰富的细节，如草地和石头被保留。这是因为它调节了数据集分布，增强了纹理表示中存储的高频细节使用更高的表面表示权重生成更平滑的纹理原因是引导过滤平滑训练样本并减少密集纹理图案。为了得到更抽象、更稀疏的特征，我们可以增加结构表示的权重，8097(a) 照片（b）快速神经风格（c）图像抽象（d）CycleGAN（d）我们的（e）照片（f）辣椒风格（g）新海风格（h）细田风格（i）HayaoStyle（j）我国图9：定性比较，Second raw显示了4种不同风格的CartoonGAN [6]。方法照片[20]第二十话CycleGAN [48][21]第二十一话我们动画片162.89146.34141.50130.38101.31FID照片N/A103.48122.1275.2828.79方法[6]第六话细田风格[6]Hayao风格[6]辣椒风格[6]我们动画片135.94130.76127.35127.05101.31FID照片37.9658.1386.48118.5628.79表3：基于FID山脉被抽象成稀疏的色块。这是因为选择性搜索算法对训练数据进行了分类，并将其抽象为结构表示。总之，与黑盒模型不同，我们的白盒方法是可控的，可以很容易地调整。4.4. 定性比较我们的方法和以前的方法之间的比较如图9所示。白盒框架有助于生成干净的轮廓。图像的提取会导致图像轮廓的噪声和混乱，而以往的方法都不能产生清晰的边界，而本文的方法具有清晰的边界，如人脸和云。卡通形象也有助于保持色彩和谐。CycleGAN生成暗化图像， Fast Neural Style 导致颜色过度平滑，CartoonGAN扭曲颜色，如人脸和船只。我们的方法，相反，防止不适当的颜色修改，如脸和船舶.最后，我们的方法有效地减少了伪影，同时保留了细节，例如坐在石头上的人，但所有其他方法都会导致过度平滑的特征或失真。折磨此外，CycleGAN、图像提取和某些CartoonGAN风格的方法会导致高频伪影。综上所述，我们的方法优于以前的方法，在生成的图像具有和谐的颜色，干净的边界，精细的细节，和较少的噪声。4.5. 定量评价Frechet起始距离（FID）[15]广泛用于定量评估合成图像的质量。预训练的Inception-V3模型[36]用于提取图像的高级特征并计算两个图像分布之间的距离。我们使用FID来评估以前的方法和我们的方法的由于Cartoon-GAN模型尚未在人脸数据上进行训练，为了公平比较，我们只在风景数据集上计算FID如表3所示，我们的方法生成具有最小FID到卡通图像分布的图像，这证明它生成与卡通图像最相似的结果。我们的方法的输出也有最小的FID到真实世界的照片分布，表明我们的方法忠实地保存图像内容信息。8098(a) 原始照片（b）W/O纹理表示（c）W/O结构表示(d)W/O表面表示（e）完整模型图10：通过移除每个组件进行的[20]第20话第六季卡通质量，平均值2.347 2.940 2.9774.017卡通质量，标准1.021 1.047 1.4370.962综合素质，平均值2.38 2.937 2.7433.877整体质量，标准差0.993 1.046 1.3210.982表4：用户研究结果，分数越高，质量越好。第1行和第2行表示卡通质量评分的平均值和标准误，第3行和第4行表示总体质量评分的平均值和标准误。4.6. 用户研究图像卡通化的质量具有很强的主观性，受个人偏好的影响很大。我们进行了用户研究，以显示用户如何评价我们的方法和以前的方法。用户研究涉及30幅图像，每幅图像都由我们提出的方法和以前的三种方法处理。要求10名候选人按照以下标准在2个维度上对每个图像进行1-5的评分：卡通质量：要求用户评估显示的图像和卡通图像的相似程度。整体质量：要求用户评估图像上是否存在颜色偏移、纹理失真、高频噪声或其他他们不喜欢的伪影。我们总共收集了1200个分数，并显示了每个算法的平均分数和标准误差表4。我们的方法优于以前的方法在卡通quality和整体质量，因为我们得到更高的分数，在这两个标准。这是因为我们提出的表示有效地提取了卡通特征，使网络能够合成高质量的图像。我们的方法的合成质量也是最稳定的，因为我们的方法在两个标准中具有最小的标准误差。原因是我们的方法是可控的，可以通过平衡不同的组件来稳定。总之，我们的方法优于用户研究中显示的所有以前的方法4.7. 各组分我们在图10中显示了消融研究的结果。重复纹理表示会导致细节混乱如图10（a）所示，草地上的不规则纹理和狗的腿仍然存在。这是由于缺乏高频存储在表面表示，这决定了模型在图10（b）中，简化结构表示会草原和山区出现严重的椒盐现象。这是因为结构表示使图像变平并去除了高频信息。简化曲面表示会导致噪波和杂乱的细节。图10（c）显示了云的不清晰边缘和草原上的噪音。原因是引导滤波抑制了高频信息并保留了平滑表面。作为比较，我们的完整模型的结果如图10（d）所示，它具有平滑的特征，清晰的边界和更少的噪声。总之，所有三种表示都有助于提高我们的方法的自动化能力。5. 结论本文提出了一种基于GAN的白盒可控图像卡通化框架，可以从真实照片中生成高质量的卡通化图像图像被分解为三个卡通表示：表面表示、结构表示和纹理表示。利用相应的图像处理模块提取三种表征用于网络训练，并通过调整各表征在损失函数中的权重广泛的定量和定性实验，以及用户研究，已经进行了验证我们的方法的性能。消融研究也被用来证明每个代表的影响。6. 确认这项工作是与Style2Paints研究团队合作进行的。我们要感谢张绿敏写的介绍和一个体面的反驳。我们也感谢博士的帮助。李成泽博士朱彩芝博士张唐博士及张博士。Ahmed M. 纳吉布8099引用[1] Mart´ın Abadi， Paul Barham ， Jianmin Chen ， ZhifengChen ， Andy Davis ， Jeffrey Dean ， Matthieu Devin ，Sanjay Ghe-mawat，Geoffrey Irving，Michael Isard，etal. Tensorflow：一个大规模机器学习系统。在第12届Sym-2016年操作系统设计和实现，第265-283页。5[2] Radhakrishna Achanta ， Appu Shaji ， Kevin Smith ，Aurelien Lucchi，PascalFua和SabineSüsstrunk。切片超像素与最先进的超像素方法的比较。 IEEE Transactions onPattern Analysis and Machine Intelligence，34（11）：2274-2282，2012。2[3] Eirikur Agustsson和Radu Timofte。Ntire 2017挑战单幅图像超分辨率：数据集和研究。在IEEE计算机视觉和模式识别会议上，2017年7月。5[4] Hussein A Aly和Eric Dubois。基于新观测模型的全变差正则化图像上采样。 IEEE Transactions on ImageProcessing，14（10）：16475[5] 赛毕、韩晓光、益州余。一种用于边缘保持平滑和场景级内分解的l1图像变换。ACM Transactions on Graphics（TOG），34（4）：78，2015. 2[6] 杨晨，赖玉坤，刘永进。Cartoongan：用于照片卡通化的生成对抗网络在IEEE计算机视觉和模式识别会议论文集，第9465-9474页，2018年。一三五七八[7] Dorin Comaniciu和Peter Meer。Mean Shift：A RobustApproachTowardFeatureSpaceAnalysis.IEEETransactions on Pattern Analysis Machine Intelligence ，（5）：603-619，2002。2[8] Vincent Dumoulin ， Jonathon Shlens ， and ManjunathKud-lur. 对艺术风格的博学的表现arXiv预印本arXiv：1610.07629，2016。3[9] Qingnan Fan ， Jiaolong Yang ， David Wipf ， BaoquanChen，and Xin Tong.通过无监督学习进行图像平滑。SIGGRAPH Asia 2018 技术论文，第 259 页。 ACM ，2018。2[10] Zeev Farbman ， Raanan Fattal ， Dani Lischinski ， andRichard Szeliski.边缘保留分解，用于多尺度色调和细节处理。ACMTransactions on Graphics（TOG），第27卷，第67页。ACM，2008年。2[11] Pedro F Felzenszwalb和Daniel P Huttenlocher。高效的基于图的图像分割。 International Journal of ComputerVision，59（2）：167-181，2004. 2[12] Leon A Gatys，Alexander S Ecker，and Matthias Bethge.艺术风格的神经算法。 arXiv 预印本 arXiv ：1508.06576，2015。3[13] 伊恩·古德费洛、让·普盖特-阿巴迪、迈赫迪·米尔扎、许冰、大卫·沃德-法利、谢尔吉尔·奥扎尔、阿伦·库维尔和约舒亚·本吉奥。生成性对抗网。神经信息处理系统进展，第2672-2680页，2014年。3[14] 何开明，孙建，唐晓鸥。引导图像滤波。欧洲计算机视觉会议，第1-14页。施普林格，2010年。2[15] Martin Heusel、Hubert Ramsauer、Thomas Unterthiner、Bernhard Nessler和Sepp Hochreiter。两个时间尺度更新规则训练的甘斯收敛到一个局部纳什均衡。神经信息处理系统进展，第6626-6637页，2017年。五、七[16] Xun Huang和Serge Belongie。实时任意样式传输，具有自适应实例规范化。在IEEE计算机视觉国际会议论文集，第1501-1510页，2017年。3[17] Xun Huang ， Ming-Yu Liu ， Serge Belongie ， and JanKautz.多模态无监督图像到图像翻译。在欧洲计算机视觉会议（ECCV）的会议记录中，第172-189页，2018年。3[18] Andrey Ignatov 、 Nikolay Kobyshev 、 Radu Timofte 、Kenneth Vanhoey和Luc Van Gool。Wespe：弱监督数码相机照片增强器。在IEEE计算机视觉和模式识别研讨会会议集，第691-700页，2018年。3[19] Phillip Isola，Jun-Yan Zhu，Tinghui Zhou，and Alexei AEfros.使用条件对抗网络的图像到图像翻译。在IEEE计算机视觉和模式识别会议论文集，第1125- 1134页，2017年。三、五[20] 贾斯汀·约翰逊，亚历山大·阿拉希，李飞飞。实时风格转换和超分辨率的感知损失。欧洲计算机视觉会议，第694施普林格，2016年。一三五七八[21] Henry Kang，Seungyong Lee，and Charles K Chui.基于流的图像抽象 . IEEE transactions on visualization andcomputer graphics，15（1）：62-76，2008。三、五、七[22] Tero Karras Samuli Laine和Timo Aila一个基于样式的生成器架构，用于生成对抗网络。在IEEE计算机视觉和模式识别会议论文集，第4401-4410页5[23] Diederik P Kingma和Jimmy Ba。Adam：随机最佳化的方法。arXiv预印本arXiv：1412.6980，2014。5[24] JanEricKyprianstan和JürgenD oüllner. 基于结构自适应滤波的图像提取TPCG，第513[25] 李欣英、曾鸿宇、黄佳斌、曼尼什·辛格和杨明轩。通过解纠缠的表示进行不同的图像到图像的翻译。在欧洲计算机视觉会议（ECCV）的会议记录中，第35-51页，2018年。3[26] Yijun Li ， Chen Fang ， Aaron Hertzmann ， EliShechtman，and Ming-Hsuan Yang.Im2pencil：可控铅笔插图从照片。在IEEE计算机视觉和模式识别会议论文集，第1525-1534页3[27] 林宗义、迈克尔·梅尔、塞尔日·贝隆吉、詹姆斯·海斯、皮埃特罗·佩罗纳、德瓦·拉马南、皮奥特·多尔·拉尔和C·L·劳伦斯·齐特尼克。微软coco：上下文中的公用对象。欧洲计算机视觉会议，第740-755页。Springer，2014. 58100[28] 策武路、黎诩、贾娅。素描与色调相结合的铅笔画制作。在 ProceedingsoftheSymposiumonNon-Photorealistic Animation and Rendering，第65-73页欧洲制图协会，2012年。3[29] Dongbo Min ， Sunghwan Choi ， Jiangbo Lu ， BumsubHam，Kwanghoon Sohn，and Minh N Do.基于加权最小二乘的快速全局图像平滑。IEEE Trans-actions on ImageProcessing，23（12）：5638-5653，2014。2[30] 阿拉斯泰尔P摩尔，西蒙JD王子，乔纳森沃勒尔，奥马尔穆罕默德和格雷厄姆琼斯。超像素晶格。在IEEE计算机视觉和模式识别会议的Proceedings中，第1-8页Citeseer，2008年。2[31] 格雷格·莫里使用分割引导模型搜索。在IEEE计算机视觉国际会议论文集，第2卷，第1417-1423页。IEEE，2005年。2[32] Deepak Pathak 、 Philipp Krahenbuhl 、 Jeff Donahue 、Trevor Darrell和Alexei A Efros。上下文编码器：通过图像修复进行特征学习。在 Proceedings of the IEEEConference on Computer Vision and Pattern Recognition，第2536-2544页3[33] Artsiom Sanakoyeu、Dmytro Kotovenko、Sabine Lang和Bjorn Ommer。一种实时高清风格传输的风格感知内容丢失。在欧洲计算机视觉会议（ECCV）的会议记录中，第698-714页，2018年。3[34] Zoya Shahcheraghi和John See。视频卡通化中双边滤波器的前后处理效果研究。在IEEE信号和图像处理应用，第37IEEE，2013。3[35] Karen Simonyan和Andrew Zisserman用于大规模图像识别的非常深的卷积网络。 arXiv 预印本 arXiv ：1409.1556，2014。4[36] Christian Szegedy、Vincent Vanhoucke、Sergey Ioffe、Jon Shlens和Zbigniew Wojna。重新思考计算机视觉的初始架构在 Proceedings of the IEEE Conference onComputer Vision and Pattern Recognition，pages 28187[37] 卡洛·托马西和罗伯托·曼杜奇。灰度和彩色图像的双边滤波。国际计算机视觉杂志，第98卷，第2页，1998年。2[38] Jasper RR Uijlings、Koen EA Van De Sande、Theo Gevers和Arnold WM Smeulders。目标识别的选择性搜索。International Journal of Computer Vision，104（2）：154-171，2013。4[39] 汤姆·范·莱尔霍文乔里·利森博格和弗兰克·范·里斯在分布式纸模型上的实时水彩画。在Proceedings ComputerGraphics International，2004中。第640-643页。IEEE，2004年。3[40] 安德烈·维达尔迪和斯特凡诺·索阿托。用于模式搜索的快速移位和核方法。欧洲计算机视觉会议，第705-718页。Springer，2008. 2[41] Jue Wang ， Yingqing Xu ， Heung-Yeung Shum ， andMichael F Cohen. 录像带。在 ACM Transactions onGraphics（ToG），第23卷，第574-583页中。ACM，2004年。3[42] Huikai Wu ， Shuai Zheng ， Jun

下载后可阅读完整内容，剩余1页未读，立即下载