基于统计的文本效果传输

20 浏览量更新于2023-10-15 收藏 2.26MB PDF 举报

字体设计

文本效果

身份认证购VIP最低享 7 折!

30元优惠券

1Awesome Typography：基于统计的文本效果传输Shuai Yang，Jiaying Liu，Zhouhui Lian，Zhongming Guo北京大学计算机科学与技术研究所摘要在这项工作中，我们探讨的问题，产生扇tastic特殊效果的排版。由于模型的复杂性，不同的字符显示出不同的文本效果是相当困难的。为了解决这个问题，我们的核心思想是利用文本效果空间分布的高度规律性来指导合成过程。具体地说，我们通过规范化的位置和最佳尺度来描述风格化的补丁，以描述其风格元素。我们的方法首先估计这两个特征，并从统计学上推导出它们的相关性然后将其转化为纹理变换的软约束，实现自适应多尺度纹理合成，使风格元素分布均匀。它允许我们的算法产生艺术排版，适合本地纹理模式和全球的空间分布的例子。实验结果表明，我们的方法优于传统的风格转移方法的各种文本效果。此外，我们验证了我们的算法与广泛的艺术排版库生成的有效性。1. 介绍字体设计是一种设计特殊文字效果的技术，使字符成为一个原始的和独特的艺术品。这些惊人的文字风格包括基本的效果，如阴影，轮廓，颜色和复杂的效果，如燃烧的火焰，流动的烟雾，五彩霓虹灯，如图所示。1.一、通过精心设计的特殊效果装饰的文本变得更具吸引力。它也可以更好地反映设计师的思想和情感。文字效果的美观和优雅备受赞赏，使其广泛应用于出版和商业领域。t.然而，创建生动的文本效果需要一个有经验的设计师使用编辑软件进行一系列微妙的过程：确定颜色风格，扭曲纹理以匹配文本形状，并调整透明度以获得视觉上的合理性等。这些先进的编辑技能远远超出了*通讯作者本工作得到国家自然科学基金项目的资助。61472011和没有。61472015。图1.该方法以源文本图像S、对应的风格化图像S′和目标文本图像T作为输入，自动生成具有S′中特殊效果的目标风格化图像T′。大多数普通用户的能力。这一实际要求激励着我们的工作：我们研究了一种自动将艺术家设计的各种奇妙的文本效果转移到原始纯文本上的方法，如图所示。1.一、语篇效果迁移是风格迁移的一个新的分支。风格转移可以分别与颜色和纹理转移相关。颜色转移匹配目标和源图像的全局[27]或局部[31纹理转换依赖于纹理合成技术，其中纹理生成受到引导图像的约束。同时，纹理合成可以分为两类：非参数方法[7，6，15，35]和参数方法[14，9，17，11]。前者通过从原始纹理中恢复像素或补丁来生成新的纹理，而后者使用统计测量对纹理进行建模，并生成与原始纹理共享相同参数结果的新纹理。从技术角度来看，直接利用传统的风格转换方法来生成新的文本效果是相当具有挑战性和不切实际的。挑战在于三个方面：（i）文字效果和文字形状的极端多样性：风格的多样性使得转换任务难以统一建模。此外，该算法应该对各种各样的字符具有鲁棒性（i-i）风格元素的复杂构成：文本效果图像通常包含多个相互交织的样式元素（我们称之为文本子效果），这些样式元素具有非常大的差异。7464输入输出火焰牛仔面料熔岩霓虹目标文本T源效应S'原文S我们的结果T'7465不同的纹理和结构（见图中的牛仔布织物示例）。（1）需要专门的治疗。(iii)引导图像的简单性：原始的纯文本作为指导给出了一些关于如何放置不同子效果的提示。白色文本和黑色背景区域中的纹理可能不保持平稳性。这使得传统的非参数纹理方法[12]失败，该方法假设纹理在引导图的每个区域中是固定的同时，纯文本图像提供了少量的语义信息。这使得最近成功的参数化深度风格转换方法[10，17]失去了表示高级语义信息的优势。由于这些原因，用于一般样式的传统样式转换方法在文本效果上表现不佳。在本文中，我们提出了一种新的文本效果转移算法来解决这些挑战。其核心思想是分析和建模基于距离的高质量文本效果的基本特征，并利用它们来指导合成过程。基于对数十种精心设计的文本效果的分析，将特征这种先验指导我们的风格转换过程自适应地合成不同的子效果所有的测量都是精心设计的，以达到一定的鲁棒性的字符形状。此外，我们进一步考虑心理视觉因素，以提高图像的自然度。总之，我们的贡献有三个方面：• 我们提出了一个全新的主题，文字效果转移，把普通的文字变成梦幻般的艺术品，它具有广泛的应用场景，如图片创作。社交网络和商业平面设计。• 我们对设计良好的字体进行了调查和分析，并总结了高质量文本效果的关键距离特征。我们对这些特征进行数学建模，以形成可用于显著改善文本的风格转换过程的通用先验。• 我们提出了第一种方法来生成引人注目的文本效果，它与源共享相似的局部纹理模式和全局空间分布例如，同时保持图像的自然性。2. 相关工作颜色转移。开创性的颜色转移方法[27，25]通过匹配其全局颜色分布在图像之间转移颜色。随后，基于分割[31，32]或用户交互[34]实现局部颜色转换，并使用细粒度补丁[30]或像素[29，24]对应关系进一步改进。最近，使用深度神经网络的颜色转换[36]和着色[16，37非参数纹理合成与传递。 E-fros和Lueng [7]提出了一种开创性的基于采样相似补丁的逐像素合成方法。后续的工作通过合成面片而不是像素来提高图像的质量和速度为了处理相邻面片的重叠区域以实现无缝性，Lianget al. [19]提出了混合补丁，埃夫罗斯和弗里曼[6]使用动态规划在重叠区域中找到最佳分界线，通过图切割进一步改进[15]。与以前的方法，在本地的方式合成纹理，最近的技术合成全球使用的目标函数。提出了一种基于相干性的函数[35]，以迭代的粗到细方式合成纹理该方法交替执行块匹配和投票操作，并获得良好的局部结构。然后，通过补丁几何和光度变换[2，5]，它被扩展到适应非静态纹理纹理转移，也称为图像类比[12]，生成纹理，但也保持目标图像的结构。通常通过减小源和目标制导图之间的差异来保留结构[12，23]。在[21]中，优先合成纹理边界以约束结构。Frigo等人[8]提出了一种自适应补丁分区，以精确捕获源纹理并保留目标结构，然后使用马尔可夫随机场（MRF）函数进行全局纹理合成。参数化纹理合成与传递。使用统计测量建模纹理的想法导致了texton及其变体的发展[14，26]。如今，基于深度的纹理合成[9]开始成为趋势这是因为深度神经网络具有强大的描述能力Gatys等人提出在卷积神经网络（CNN）特征空间中使用Gram-matrix来表示纹理[9]，并通过合并内容相似性使其适应风格转换[10]。这项工作提出了值得注意的通用绘画转移技术，并在损失函数改进[20，28]和al-tax加速[13，33]方面吸引了许多后续研究。最近，提出了用MRF正则化器替换Gram-matrix的方法用于摄影合成[17]和语义纹理转移[3]。与此同时，生成对抗网络（GAN- s）[11]提供了另一种通过使用生成器和生成器网络生成纹理的想法，该生成器和生成器网络通过玩极大极小博弈来迭代改进模型。它的扩展，条件GAN [22]，完成了从抽象语义标签生成图像的挑战性任务。Li和Wand [18]进一步表明，他们的MarkovianGAN在相干纹理保留方面比基于Gram-matrix的方法[10，33]具有一定的优势。3. 该方法在本节中，我们首先制定我们的文本效果转移问题。视觉分析，然后提出对我们的观察-7466距离(a) 火焰（b）图案分布（c）牛仔布（d）图案分布栅极角环(e) 分割模式(f) RGB空间中的像素（g）像素距离分布斑块大小(h)响应曲线（距离模式）斑块大小(i)响应曲线（随机模式）图2. 统计图像的文字效果。（a）（c）火焰和牛仔布织物的文字效果。（b）（d）与文本骨架（白色）距离相似的纹理往往具有相似的模式。(e)使用不同的分区模式将像素划分为N= 16个类。（f）-（g）像素颜色和距离之间的高度相关性：像素通过它们在RGB空间中的距离彼此区分。（h）-（i）斑块规模与距离之间的高度相关性：具有相似距离的斑块对其大小的变化具有一致的响应。贴片图案之间的高相关性（即，颜色和比例）及其在文本效果图像中的空间分布（第二节）。第3.1节）。基于这一观察，我们从源图像中提取文本效果统计（第二节）。3.2），并采用它来适应纹理合成算法的高质量的文本效果传输（节。3.3）。3.1. 问题表述与分析文本效果传送将源原始文本图像S、源风格化图像S′和目标原始文本图像T这三个图像的集合作为输入，然后自动产生具有文本效果的目标风格化图像T′，使得S：S′：：T：T′。对于我们的基于块的算法，在下文中，我们分别使用p和q来表示T/T′和S/S′中的像素，并分别使用P（p）和P′（p）来表示T和T′中以p为S和S′中的补片Q（q）和Q′（q）也是如此。要实现任意文本效果的自动转换，必须面对文本效果的多样性、文本子效果的复杂组合和引导图的简单性因此，这是一项相当具有挑战性的任务。如何合成更好的文本效果仍然是一个悬而未决的问题。也就是说，（i）使文本效果更可取的基本因素以及（ii）我们如何捕捉这些特征以进行综合？幸运的是，在对设计师创造的数十种文本效果进行数学分析后，我们找到了线索：贴片图案之间的高相关性（即，颜色和比例）以及它们到文本骨架的距离。我们注意到纹理具有与文本骨架相似的距离的文本往往共享相似的模式。其示意性地示出在图1A和1B中。2（b）（d）其中到骨架（白色）具有相同距离的贴片这一观察结果与现实世界中设计师基于文本形状进行的可读性纹理自适应一致。为了定量验证这种相关性，我们将文本效果图像中的像素/补丁根据它们与文本骨架的距离分为N类（距离计算将在第二节中给出）。3.2.2），并以氮粒分化为度量。基于距离的划分的两个示例在图1的顶行中示出2（e），其中我们利用不同的颜色来表示每个类。对于像素颜色，以火焰图像为例，通过在RGB空间中标记每个点（图1）。2（f））与它的类-颜色，我们注意到，图中的点。2（g）具有相同类颜色的像素出现在邻域中，这意味着像素颜色与它们的距离值具有强相关性。因此，我们将其量化为分类精度，corr（color， dist）= 1−1，（1）其中，k是通过训练SVM [4]对给定的基于距离的分区的像素颜色进行分类而获得的训练误差对30幅由设计师创作的文字效果图进行像素颜色与距离值的平均相关性为0。147.我们还提供了其他三种分区模式（如图1底行所示）2（e））以及随机分配模式用于实验中的比较。他们的卑鄙行径-贴片差异贴片差异7467ℓℓℓℓ表1.斑块模式和不同模式之间的相关性Corr兰德网格角度环Dist颜色0.0630.1060.1190.1050.147规模0.1530.7930.4860.5900.950在表1的第二行中示出了在30个测试图像上与像素颜色的关系。正如预期的那样，距离是描述像素颜色的最重要因素。对于斑块尺度，我们枚举斑块大小并计算每个斑块与其最佳匹配之间的差异109876543210(a) 最优比例尺地图(b) 可视化斑块尺度其形成不同比例下的响应曲线。以牛仔面料图像为例，图2（h）和（i）分别示出了在距离和随机模式下斑块大小的N响应曲线。曲线上的每个点给出了相应类别中某个贴片尺寸下贴片差异的平均值和标准差。我们发现：（i）距离模式下的响应曲线更加多样化（高曲线间标准差σinter），这意味着不同的子效应可以通过其距离值很好地区分。(ii)距离模式下响应曲线上的点具有较低的标准差（低曲线内标准差σintra），这意味着斑块具有相似的距离图3.检测到火焰图像的最佳补丁比例我们使用固定的m×m补丁大小，并调整图像大小以实现多尺度。设S是下采样源S，缩放率为1/s−1，Q（q）是S中以q/s −1为中心的补丁。S′和Q′（q）的定义类似。如果q是q在尺度上的对应，q=argmin<$Q（q ） −Q （ q）<$2+<$Q′（q ）−Q′（q）<$2，（3）则我们在标度<$的滤波器准则为.√Σσ（q，q）=σ+d（q，q）> ω，（4）对尺度变化的反应是一致的，并且可能共享用于描述的共同的最优尺度考虑到这两个其中，σ=√′Va r（Q<$（q））/2。P匹配满足过滤器方面，我们评估的相关性与斑块规模，corr（scale，dist）= σinter/σintra.（二）标准通过到更精细的尺度-1，而过滤器残基设置为它们的最优尺度。的示例火焰图像的最佳尺度如图所示。第3（a）段。它这里σ 除其他和σ帧内定义为标准偏差的总和-发现字符附近的纹理区域比外部平坦区域需要更精细的补丁尺度为了更好的视觉-不同的补丁大小。给定贴片大小，σ为对于σinter，是不同曲线中N个点的平均贴片差异的标准差，对于σintra，是N个点的标准差- s的平均值。表1的底行示出了在距离拥有最高值的30个图像上的斑块尺度与不同模式基于像素颜色和补丁比例的结果，我们得到的结论是，补丁模式之间的高度相关性和它们的距离是合理的必要条件高质量文本效果的特性。3.2. 文本效果统计估计我们现在将上述分析转换为补丁统计数据，可以直接用作传输指导。具体来说，我们检测源补丁的最佳尺度，并估计它们到文本骨架的归一化距离然后，我们能够推导出后验概率的最佳规模为每个补丁的基础上，其空间位置。3.2.1最优斑块尺度检测受[8]的启发，我们提出了一种简单而有效的方法来检测最佳的补丁尺度scal（q）来描述q周围的纹理模式。给定预定义的下采样因子s，我们从最大（最粗糙）尺度L开始过滤源块，并让筛选后的块传递到更精细的尺度。7468化，我们在图中以sscal（q）−1的缩放速率通过缩放来显示补丁Q（q）3（b）款。3.2.2鲁棒归一化距离估计在这里，我们首先定义一些概念。在文本图像中，它的文本区域由 “” 表示。 skeleton skel （ skel ）是skeleton中的一个内核路径。我们使用dist（q，A）表示q与集合A中最近像素之间的距离。我们将计算dist（q， skel（q））。对于文本轮廓δ上的q，距离也称为文本宽度或半径r（q）。图4（b）给出了视觉解释。我们使用形态学操作从S中提取skel（S）。为了确保距离不随文本宽度变化，我们的目标是将距离归一化，使得归一化的文本宽度等于1。简单地将距离除以文本宽度是不可靠的，因为所获得的skel（距离）的不准确也会导致分子和分母中的错误。为了解决这个问题，我们基于统计学估计校正的 te xt 宽度 r（q），并使用精确的dist（q，δk）以导出归一化的dist（q， skel（k））。具体地说，我们对r（q），<$q∈δ <$进行排序，得到它们的秩rank（q）.我们观察到r（q）和rank（q）之间的关系可以通过线性回归很好地建模，如示于图第4段（d）。从图4（b）（d），我们发现，7469最后，后验概率P（|bin（q））是描绘具有对应于bin（q）的距离的片的适当尺度，可以推导出：ΣP（|bin（p））= P（n，bin（p））/ℓP（n，bin（p））。（九）(a) 文本图像(c) di st（q， skel（））(b)记法定义151051级（q）0(d) r（q）与秩（q）的线性关系我们假设目标图像与源图像具有相同的后验概率。我们将使用这个概率来选择补丁尺度统计纹理合成，以适应各种各样的文本效果。3.3. 文字效果转移在这一节中，我们描述了我们如何调整传统的纹理合成方法来处理具有挑战性的文本效果。我们建立在Wexler等人的纹理合成方法上。 [35]及其变体[5]使用随机搜索图4.鲁棒归一化距离估计。(a)文本IM-年龄(b)我们检测到的文本框架和符号定义。(c)估计的标准化距离。文本边界上的像素到文本骨架的距离被规格化为1（用洋红色着色）。(d)文本宽度的统计信息。离群值聚集在小值处。我们根据经验假设最左边的20%点是离群值，并通过以下方法消除它们：r∈（q）=max（dist（q，s k el（q）），0.2K|δΩ|+b）、（5）其中k、b是线性回归系数，|δΩ|是δ的像素数。最后，得到归一化距离.δ1+dist（q，δ2）/r，如果q∈/r和传播如PatchMatch [1，2]。我们参考这些论文的基本算法的细节。我们将字符形状约束应用于补丁外观测量以建立我们的基线，并进一步将估计的文本效果统计数据结合起来，以实现自适应多尺度风格转换（第二节）。3.3.2）。然后引入分布项来调整文本子效果的空间分布（Sec. 3.3.3）。最后，我们提出了一个心理视觉术语，防止纹理过度重复的自然性（第二节）。3.3.4）。3.3.1目标函数我们增加了[35]中的纹理合成目标函数dist（q， skel（q））=1−dist（q，δ）/r（q、（6）），其他通过包括分布项和心理视觉项。我们的目标函数采用以下形式，其中，q∈δε是沿δ ε距离q最近的像素，r= 0。5K|δΩ|+b是文本的平均宽度。Σ最小EQpapp（p，q）+λ1EDist（p，q）+λ2EPsy（p，q），（10）为了简单起见，我们省略了skel（k），而使用dist（q）来引用在下面的句子中，将[i]改为[i]3.2.3最优尺度后验概率估计在本节中，我们推导出最佳斑块尺度的后验概率，以模拟上述斑块模式及其空间分布之间的高我们将所有距离统一量化为100个bin，并将bin（q）表示为binq所属。然后，计算二维直方图hist（x，x）Σ其中p是目标块在T和T′中的中心位置，q是对应的源块在S和S′中的中心位置。三个项Eapp、Edist和Epsy分别是外观项、分布项和心理视觉项，它们由λ1和λ2加权以一起构成斑块距离。3.3.2外观术语：纹理风格转换Wexler等人的原始纹理合成算法。[35]最小化从纹理图像对S′/T′采样的两个补丁的平方差之和（SS- D）。hist（ x）=n（scal（q）=x），（7）Qdist（q2，skel（Ω））Q2Ωr（q）⊥qdist（q，δΩ）qr（q7470我们通过应用额外的从文本图像对S/T采样的两个块的SSD：其中，当该规则为真时，f（·）为1，否则为0。并且距离和最优尺度的联合概率可以被估计为，ΣP（λ，x）= hist（λ，x）/hist（λ，x）。（八）x，xEapp（p，q）=λ3<$P（p）-Q（q）<$2+<$P′（p）-Q′（q）<$2，（11）其中λ3是在色差和字符形状差之间折衷的权重。我们把产科-只最小化出现项的射函数，当量（11）作为我们的基线。7471E2风格化文本通常包含具有不同最佳表征尺度的多个子效应。因此，除了基线，我们提出了自适应尺度感知补丁距离，通过将估计后验概率，ΣEap p（p，q）=λ3P（λ|bin（p））<$P<$（p）−Q<$（q）<$2ℓ+P（|bin（p））<$P ′（p）−Q′（q）<$2。（十二）ℓ ℓℓ(a)m= 5，L= 1（b）m= 15，L= 1 （c）m= 5，L= 5后验概率有助于探索补丁通过多个适当的比例，更好的纹理合成。3.3.3分布术语：空间风格迁移子效果的分布与它们到文本骨架的距离高度相关。基于此先验，我们引入一个分布项，.Σ2dist（p，q）=dist（p）- dist（q）/max（1，dist（p）），（13）其促使目标的文本效果与源图像共享相似的分布，从而实现空间风格转移。为了确保成本不随图像尺度变化，我们添加分母max（1，dist2（p））。3.3.4视觉心理学术语：自然保护纹理的过度重复会严重降低人在审美上的主观评价因此，我们的目标是惩罚某些源补丁被重复选择。令Φ（q）是当前找到q作为其像素的像素集合。信函和|Φ（q）|是集合的大小。我们将心理视觉术语定义为，Epsy（p，q）= |Φ（q）|.（十四）从q的角度来看，我们可以更好地理解这种重复性惩罚：图5. 多尺度战略的影响。(a)使用单尺度5×5贴片的结果。(b)使用单尺度15×15贴片的结果。(c)使用5个尺度上的联合5×5贴片的结果。(a) λ1= 0。0（b）λ1= 0。1（c）λ1= 0。1+初始化图6. 分布项的影响。(a)无差异项的结果。(b)随机初始化和带分布项的优化得到的结果。(c)通过初始化和具有分布项的优化得到的结果。4. 分析外观术语。该方法的优点在于：（1）保留了粗纹理结构;(ii)保留纹理细节。我们在图中示出。图5（a）和（b）分别使用单尺度5×5和15×15贴片生成的牛仔面料小块斑块捕获的上下文信息非常有限，因此不能保证结构的连续性。如可见于图5（a）、缝纫线看起来有裂纹，且方向不一致然而，选择大的补丁导致Σ|Φ（q）|为pΣ ΣQp ∈ Φ（q）|为|=Σ|Φ（q）|二、（十五）Q以平滑微小的线程残留物，如图。5（b）。通过联合使用5×5块贴片，以来ΣQ|Φ（q）|为|不|是常数，Eq.（15）到达5个级别如图。5（c），整体形状良好，像缝纫线一样的细节看起来更生动。最小值，当所有|Φ（q）|平等意思是我们的神经病-视觉术语鼓励均匀地使用源补丁3.3.5函数优化我们遵循迭代的粗到精匹配和投票步骤，如[35]所示。在匹配步骤中，采用PatchMatch算法[1，2]。我们在每次迭代搜索和传播心理视觉项之后更新Φ（q）同时，T′的初始化在最终结果中起着重要作用，因为我们的指导图提供了非常好的对纹理的限制很少我们投票的源补丁搜索，只有最小化方程。（13）形成我们对T′的初始猜测。这个简单的策略显著改善了最终结果，如图所示。六、7472分销期限。分布项确保目标图像和源示例中的子效果分布相似，这是我们在第二节中假设的基础3.2.3后验概率P（|x）在T ′中，S是一样的。图6显示了分布火焰风格的术语如果没有分布限制，火焰在黑色背景中随机出现。离散项调整火焰，以更好地匹配其空间分布，如源示例中那样。心理视觉术语我们的心理视觉术语的影响如图所示。7.第一次会议。熔岩纹理合成没有心理视觉惩罚（图。7（a））在几个地区密集地重复红色裂缝，造成明显的不自然性。通过增加惩罚，7473(a) （S，S′）（b）T（c）类比[12](d)分裂&匹配[8]（e）神经涂鸦[3]（f）基线（g）拟议方法图8。与各种文本效果的最新方法进行比较。从上到下：霓虹灯烟雾牛仔布(a)输入源文本效果与左下角的原始文本对应物（b）目标案文。（c）图像类比的结果[12]。（d）分裂和匹配的结果[8]。(e)神经涂鸦的结果[3]。(f)我们的基线方法的结果。(g)所提出的方法的结果。(a) λ2= 0。0（b）λ2= 0. 005（c）λ2= 0。01图7. 心理视觉术语的影响，惩罚纹理过度重复并鼓励新的纹理创建。相同的源纹理是大大抑制（图。7（b））和我们的方法往往灵活地结合不同的源补丁，以创建全新的纹理（图。7（c））。因此，心理视觉项可以有效地惩罚纹理过度重复并鼓励新的纹理创建。三个术语的组合。值得注意的是，所提出的三个术语是互补的：第一，表观和分布术语强调局部纹理模式，分别为全局和全局文本子效果分布。前者描绘了低级别的颜色特征，而后者利用互补的中级位置特征。其次，外观和分布项共同评估客观斑块相似性。同时，心理视觉术语通过纳入美学主观评价来补充这两个术语。5. 实验结果在实验中，斑块大小为5×5，最大尺度L= 5。我们建立了一个10级的图像金字塔，固定的粗粒度（32×32）。在第二层，使用从m到min（10，m+L−1）尺度用于平衡不同项的权重λ1、λ2和λ3被设置为：0.01 、0. 005和10，分别。滤波器准则的参数ω为0。3在我们的实现1.在图8中，我们将我们的算法与三种最先进的风格转移技术以及我们的基线进行了比较。第一种方法是开创性的图像类比[12]。结果表明，纹理局部重复，整体无序，具有明显的斑块边界.第二种方法是我们实现的分割和匹配[8]，它使用自适应补丁大小合成纹理。原始方法直接转移风格在S′到T中，没有S的帮助。为了进行公平的比较，我们通过在分裂阶段使用S而不是S′来纳入指导此方法无法在背景和产生平原程式化的结果。第三种方法，神经涂鸦[3]，是基于MRF和CNN的组合[17]，并结合了语义图进行类比指导。虽然示例文本效果的调色板被转移，但精细纹理的合成效果很差。文本形状也会丢失。我们的基线传输精细的纹理，但未能保持整体的子效果分布，并在背景中产生文物。通过比较，所提出的方法优于最先进的方法，既保留了局部纹理又保留了全局子效果分布。图9，我们提出了一个例子的风格转移，1 我们在以下网址发布 Matlab 实现： https ： //github.com/wilyang1991/Text-Effects-Transfer7474(a)目标文本（b）火焰（c）熔岩（d）铁锈（e）掉落（f）爆裂（g）闪烁图9.对代表性字符（中文、字母、手写）应用不同的文本效果图10.我们的火焰排版库的概述左上角较大的图像作为生成另一个774个字符。整个图书馆以及其他程式化的图书馆可以在补充材料中找到。六个非常不同的文本效果，三个代表性的字符（中文，字母，手写）。这个实验涵盖了样式、语言和字体之间具有挑战性的转换。由于采用了距离归一化和多尺度策略，我们的算法实现了文本效果的转移，而不受字符形状和纹理尺度的影响，为艺术排版提供了坚实的工具。最后，我们展示了我们的火焰排版库，包括多达775个常用的汉字。由于篇幅所限，图中只列出了前32个。10个。整个图书馆以及其他排版图书馆都包括在我们的补充材料中。广泛的合成结果表明，我们的方法的鲁棒性，以不同的字符形状。6. 结论本文提出了文本效果迁移问题，并提出了一种新的基于几何的方法来解决这个问题。我们将子效果模式之间的高度相关性提出了一种具有三个互补项的目标函数，综合考虑局部多尺度纹理、全局子效果分布和视觉自然度。我们验证了我们的方法的有效性和鲁棒性的比较与国家的最先进的风格转移算法和广泛的艺术排版世代。未来的工作将集中在程式化文本和背景照片的组成。7475引用[1] C. Barnes，E. Shechtman ，A. Finkelstein 和D. B.黄金人。补丁匹配：一种用于结构化图像编辑的随机对应算法。 ACM Transactions on Graphics ， 28 （3 ）： 341-352，2009年8月。五、六[2] C. Barnes，E. Shechtman，D. B. Goldman和A.芬克尔-斯坦。广义补丁匹配对应算法M.在Proc. European Conf.计算机视觉，第29-43页，2010年。二、五、六[3] A.尚潘达语义风格转换与将不起眼的涂鸦变成艺术品。2016.Arabic预印本;https://arxiv.org/abs/1603.01768。二、七[4] C. C. Chang和C. J. Lin LIBSVM：支持向量机库。ACMTransactions on Intelligent Systems and Technology，2：27：1-27：27，2011.软件可在http://www.csie.ntu.edu.tw/上获得请访问cjlin/libsvm。3[5] S. Darabi、E.谢赫特曼角巴恩斯D. B.高盛，以及P. Sen.图像融合：使用基于块的合成来组合不一致的图像。ACM Transactions on Graphics，31（4）：82：1-82：10，2012年7月。二、五[6] A. A. Efros和W. T.弗里曼。图像绗缝纹理合成和转移。在proc ACM会议计算机图形学和交互技术，第341-346页，2001年。一、二[7] A. A. Efros和T. K.梁非参数采样纹理合成。在Proc.IEEE Int'l Conf.计算机视觉，1999年。一、二[8] O. Frigo，N. Sabater，J. Delon，and P.赫利尔拆分和匹配：基于示例的自适应补丁采样，用于无监督风格转换。在Proc. IEEE Int'l Conf.计算机视觉和模式识别，2016年。二四七[9] L. A. Gatys，A. S. Ecker和M.贝丝使用卷积神经网络进行纹理合成。神经信息处理系统进展，2015。一、二[10] L. A. Gatys，A. S. Ecker和M.贝丝使用卷积神经网络进行图像风格转换。在Proc. IEEE2[11] I. Goodfellow，J.Pougetabadie ，M. 米尔扎湾，澳-地Xu，L.Warde-farley，S.奥扎尔A.Courville和Y.本吉奥。生成式对抗网络。神经信息处理系统进展，第2672-2680页，2014年一、二[12] A. 赫茨曼角E. Jacobs，N.奥利弗湾Curless和D.H.销售形象类比。在proc Conf. 计算机图形和交互技术，第327-340页，2001年。二、七[13] J. Johnson，A.Alahi和F.F. 李实时风格转换和超分辨率的感知损失在Proc. European Conf. Computer Vision，2016。2[14] B. Julesz和J. R.卑尔根纹理元是前注意视觉和纹理感知的基本元素。Bell Labs Technical Journal，62（6）：243-256，1983. 一、二[15] V. Kw atra、黑果草A. 舍奥德尔岛埃萨湾 Turk和A.Bobick Graphcut纹理：使用图形切割的图像和视频合成。ACM Transactions on Graphics，22（3）：277一、二[16] G. Larsson，M. Maire和G.沙赫纳洛维奇学习自动着色的表示。在Proc. European Conf.计算机视觉，2016年。27476[17] C. Li和M.魔杖组合马尔可夫随机场以及用于图像合成的卷积神经网络。在Proc. IEEE Int'l Conf.计算机视觉与模式识别，2016。一、二、七[18] C. Li和M.魔杖用马尔可夫生成对抗网络实现预计算实时纹理合成。在Proc. European Conf.计算机视觉，2016年。2[19] L. Liang，C. Liu，Y.徐湾，澳-地Guo和H.沈基于块采样的实时纹理合成。ACM Transactions on Graphics，20（3）：127-150，2001. 2[20] T. Lin和S.玛吉可视化和理解深层纹理表征。在Proc.IEEE Int'l Conf.计算机视觉与模式识别，2016。2[21] M. Luk a'c，J. F ise r，J. C. 巴赞岛 Jamri sreplika，A.Sorkine-Hornung，D. 好的按功能：绘制用于基于示例的图像创建的图形边界 ACM Transactions onGraphics，32（4）：96-96，2013。2[22] M. Mirza和S.奥辛德罗条件生成对抗网。计算机科学，第2672-2680页，2014年。2[23] F. Okura，K. Vanhoey，A. Bousseau，A. A. 埃夫罗斯和G.讨厌鬼统一颜色和纹理转移，用于预测外观操作。Computer Graphics Forum，34（4）：53-63，2015. 2[24] J.公园，Y.泰山，西-地N.辛哈和我S.奎恩为社区照片集提供高效、稳健的色彩一致性在Proc. IEEE Int'lConf.计算机视觉与模式识别，2016。2[25] F. Piti e'，A. C. Kokaram和R. 好的使用颜色分布转移的自动颜色计算机视觉与图像理解，107（1）：123-137，2007。2[26] J. Portilla和E.西蒙切利基于复小波系数联合统计量的参数化纹理模型 2[27] E. Reinhard，M.阿希赫明湾Gooch和P.雪莉图像之间的颜色或传输。 IEEEComputerGraphicsandApplications，21（5）：34-41，2001. 一、二[28] A.塞利姆，M。Elgharib和L.道尔使用卷积神经网络进行头像ACM Transactions on Graphics，35（4）：1-18，2016。2[29] Y.施，S.巴黎角Barnes，W. T. Freeman和F. 杜兰德风格转移头像肖像。ACM Transactions on Graphics，33（4）：1-14，2014。2[30] Y. 施，S.Paris，F.Durand和W.T. 弗里曼。从一张户外照片中产生一天中不同时间的数据驱动幻觉。ACMTransactions on Graphics，32（6）：2504 2[31] Y. W. Tai，J. Jia，and C. K.唐基于期望最大化概率分割的局部颜色传递。在Proc. IEEE Int'l Conf.计算机视觉和模式识别，第747-754页，2005年。一、二[32] Y. W. Tai，J. Jia，and C. K.唐软彩色分割及其应用。IEEE Transactions on Pattern Analysis and MachineIntelligence，29（9）：1520-1537，2007。2[33] D. 乌里扬诺夫河Lebedev，A.Vedaldi和V.Lempitsky 纺织网络：纹理和风格化图像的前馈合成。在Proc.IEEE Int'l Conf.机器学习，2016年。27477[34] T.威尔士湾Ashikhmin和K.穆勒将颜色转换为灰度图像。 ACM Transactions on Graphics ， 21 （3 ）： 277-280，2002. 2[35] Y. Wexler，E.Shechtman和M.伊拉尼视频的时空IEEETransactionsonPatternAnalysisandMachineIntelligence，29（3）：463-476，2007年3月。一、二、五、六[36] Z. Yan，H.张湾，澳-地Wang，S. Paris和Y. Yu.使用深度神经网络的自动照片调整。ACM Trans-actions onGraphics，35（1），2016年。2[37] R. Zhang，P.Isola和A.A. 埃夫罗斯彩色图像着色。在Proc. European Conf.计算机视觉，2016年。2

下载后可阅读完整内容，剩余1页未读，立即下载