线搜索特征转换：逼真风格转换的快速、稳定内容调控方法

190 浏览量更新于2025-01-16 收藏 17.24MB PDF 举报

本文主要探讨的是"基于线搜索的特征转换（LS-FT）"在逼真风格转换中的应用，这是一种创新的方法，旨在实现内容图像与风格图像之间的快速、稳定且可调节的风格转换。作者Tai-Yin Chiu和Danna Gurari来自University of Texas at Austin和University of Colorado Boulder，他们提出了LS-FT，以解决现代逼真风格转换模型中的关键问题——如何在保持内容的忠实度和风格的强度之间找到最佳平衡。在当前最先进的逼真风格转换技术中，如WCT2、PhotoWCT、PhotoWCT2以及PCA-d等自动编码器模型中，这些方法依赖于特征转换模块，该模块能够融合内容和风格特征，然后通过解码生成风格化图像。LS-FT相比于AdaIN、ZCA、OST和MAST等传统方法，展现出了更出色的表现。它不仅能像PhotoWCT和PCA-d那样较好地保留内容信息，还能增强WCT2的风格化效果，同时在PhotoWCT2中实现了更好的内容和风格之间的平衡控制。作者通过一系列实验，不仅评估了现有变换在不同模型中的性能，还展示了LS-FT在保持速度、生成一致性的同时，如何显著提升风格转换的质量。这种方法的优势在于其通用性，适用于各种风格图像，而且能够在单次前向传播中完成，从而节省了计算资源，提高了效率。为了支持研究的可复现性，论文提供了详细的实现细节和代码仓库链接<https://github.com/chiutaiyin/LS-FT>。LS-FT为逼真风格转换提供了一个新的解决方案，它不仅提升了转换效果，还为内容风格控制提供了更为精细的调节手段，对于图像处理和计算机视觉领域具有重要的实际应用价值。

Tai-Yin Chiu

University of Texas at Austin

chiu.taiyin@utexas.edu

Danna Gurari

University of Colorado Boulder

Danna.Gurari@colorado.edu

https://github.com/chiutaiyin/LS-FT.

249

基于线搜索的特征转换用于逼真风格转换中的快速、稳定和可调节的内容风

格控制

图1：在四个不同的基于自动编码器的逼真风格转换模型中嵌入了五种变换，分别是WCT2[31]，PhotoWCT(PhWCT)[16]，PhotoWCT2

(PhWCT2)[6]和一个精简模型(PCA-d)[7]。我们的新变换在内容保留和风格转换之间取得了更好的平衡，优于现有的变换。与AdaIN

[10]、ZCA[15]、OST[20]和MAST[11]相比，我们的LS-FT可以更好地保留PhotoWCT和PCA-d的内容，提升WCT2

的风格化强度，并在PhotoWCT2中实现更好的内容-风格平衡。

摘要

逼真风格转换是将内容从一幅图像转换为另一幅图像的风格

时合成逼真图像的任务。现代模型通常嵌入一个融合描述内

容图像和风格图像的特征的变换，然后将结果特征解码为风

格化图像。我们引入了一种通用变换，可以控制保留多少内

容和融入的风格的强度之间的平衡。我们首次进行了一系列

实验，展示了现有变换在不同风格转换模型中的性能，并展

示了我们的变换在不同模型中同时运行快速、产生一致合理

的结果以及控制内容和风格之间的平衡方面的优势。为了支

持我们方法和模型的复现，我们在

1.引言

逼真的风格转换是一项图像编辑任务，它使用另一幅图像的

风格（我们称之为风格图像）来渲染内容图像，使得结果对

人类来说看起来像一张逼真的照片。在本文中，我们解决了

如何在保留内容的同时确保强烈采用风格的关键挑战。目前

用于逼真风格转换的最先进方法包括具有特征转换的自动编

码器[16,31,1,6,

7]。这些方法的优势在于它们可以从任意风格图像中转换风

格（即通用），由于在单次前向传递中进行预测，因此速度

快，并且不需要对任何风格图像进行训练（即无需学习风格

）。基本模型包含一个编码器来提取内容和风格图像的特征

，一个特征转换来适应内容

下载后可阅读完整内容，剩余9页未读，立即下载

cpongm

粉丝: 6

线搜索特征转换：逼真风格转换的快速、稳定内容调控方法

人脸转动漫小程序源代码

GAN学习笔记

基于Unity3D的ACT游戏的设计与实现(论文+源码)_kaic.docx

向量艺术生成：神经绘图的风格化转换

纯CSS3实现逼真漫画小女孩图像特效

CapsNet-GAN基于Tensorflow的Python实现与应用

Flutter风格迁移应用：集成Bloc、TFlite和CartoonGAN

EigenGAN：无监督学习的GAN可解释与控制维度

Python游戏开发最佳实践：提升代码质量和可维护性，打造可持续游戏

MATLAB矩阵乘法在游戏开发中的应用：创造逼真的游戏世界，提升游戏体验

最新资源