
收稿日期:20180404;修回日期:20180525 基金项目:国家自然科学基金资助项目(61402118,61673123,61603100,61702110);广东
省科技计划资助项目(2015B090901016,2016B010108007);广东省教育厅项目(粤教高函[2018]1号,[2015]133号,[2014]97号);广州市科技计
划项目(201604020145,201604030034,201508010067,201604046017)
作者简介:滕少华(1962),男,江西人,教授,博士,主要研究方向为协同计算、大数据、数据挖掘、网络安全;孔棱睿(1986),男(通信作者),广
东英德人,硕士,主要研究方向为机器学习、深度学习、计算机视觉(konglengrui@126.com).
基于生成式对抗网络的中文字体风格迁移
滕少华,孔棱睿
(广东工业大学 计算机学院,广州 510006)
摘 要:风格多样的中文字体是一种重要的中国文化符号,它的设计和操作是一项需要大量专业知识的艰巨工
作。因此,针对这项工作提出一种基于生成式对抗网络的中文字体风格迁移的新方法。实验中,使用基于残差
网络结构的生成式模型,在均方误差约束下,进行生成式模型与判别式模型之间的对抗训练,最后使用训练所得
的生成式模型实现不同中文字体间一对一和多对多的风格迁移。实验表明,与之前常用的基于 l
1
正则化方法相
比,使用这种方法在字体细节生成上有更出色的表现,简化了中文字体的建模方式,提高了生成图像的逼真度,
并具有更好的灵活性和通用性。
关键词:风格迁移;生成式对抗网络;卷积神经网络;残差网络;深度学习
中图分类号:TP391.12 文献标志码:A 文章编号:10013695(2019)10064316404
doi:10.19734/j.issn.10013695.2018.04.0330
Chinesefontsstyletransferbasedongenerativeadversarialnetworks
TengShaohua,KongLengrui
(SchoolofComputers,GuangdongUniversityofTechnology,Guangzhou510006,China)
Abstract:AvarietyofChinesecharactersisanimportantChineseculturalsymbol.Itsdesignandoperationareahardwork
requiringalotofprofessionalknowledge.Therefore,forthiswork,thispaperproposedanewmethodofChinesefontsstyle
transferbasedongenerativeadversarialnetworks.Intheexperiment
,itusedagenerativemodelbasedontheresidualnetwork
structureandperformedtheadversarialtrainingbetweenthegenerativemodelandthediscriminativemodelundertheconstraint
ofmeansquareerror.Atlast,thetrainedgenerativemodelcouldbeusedtoimplementonetooneandmanytomanystyle
transferbetweendifferentChinesefonts.Experimentsshowthat
,comparedwiththeusuall
1
regularizationmethodusedbefore,
themethodinthispaperhasbetterperformanceinfontsdetailgeneration,simplifiesChinesefontsmodeling,improvesthefidelity
ofgeneratedimages,andhasbetterflexibilityandversatility.
Keywords: styletransfer; generativeadversarialnetworks(GAN); convolutionalneuralnetworks; residualnetworks;
deeplearning
0 引言
中文字体是一种二维设计的视觉元素,它是汉字文化的主
要表现形式。与英文字体相比,博大精深的汉字具有字义丰富
和形体复杂的特点。文字专家需要花费大量的时间来设计不
同风格的中文字体,这是一项劳动密集型的工作。而且中文字
体的种类繁多,往往中文字体库所含的字体风格不能满足实际
需求。因此,本文提出了一个用于自动转换字体风格的神经网
络架构,可将所需的字体实例应用到目标项目中。
对于字形的早期研究主要基于几何建模,只能用于特定的
字形拓扑结构,不能用于图像输入。
Shamir等人
[1]
提出了一
种基于参数化特征的字体设计方法,但是这种方法的特征和约
束的提取过程不是自动完成的,需要用户干涉。Suveeranont等
人
[2]
提出了一种从用户定义的实例中自动生成新字体的方
法,可以从每个字体轮廓中提取拓扑结构,然后通过特征保留
和加权混合来生成新字体,然而所生成的新字体容易出现明显
的扭曲。与简单的英文字体相比,中文字体的风格迁移特别具
有挑战性,因为中文字体要比英文字体更复杂多变。曾理等
人
[3]
提出了一种基于多尺度非冗余小波纹理分析的文字种类
自动识别技术,可用于识别不同格式和字体的文本图像。Xu
等人
[4]
提出了一种通过分解和重组字符组件来模仿手写文字
风格的智能算法,该算法的文字生成过程过于复杂繁琐。陈飞
等人
[5]
提出了基于 SDL和 OpenGL实时绘制中文字体的方法,
优化了中文字体生成纹理图的过程,但是该方法过度依赖于图
形库,不利于功能上的扩展。
随着深度学习的发展
[6,7]
,研究人员开始对图像中的字形
建模展开研究。Baluja
[8]
在一小组字母上成功地使用深度学
习模型来区分字体,并生成相同风格的字符。
Azadi等人
[9]
提
出了一个端到端的堆栈条件的生成式对抗网络模型,有效地实
现了 10000种不同英文字母字 体 间的 风 格迁 移。Zhang等
人
[10]
提出了一种使用递归神经网络(RNN)分别作为识别汉字
的判别式模型和生成汉字的生成式模型的框架,可是对于字形
复杂的字体生成效果并不理想。Lyu等人
[11]
提出了一个可生
成中国书法风格字体图像的生成式对抗网络模型。但是该模
型设计过于复杂,不利于调整,并且使用了 l
1
正则化,容易使
得最终生成的字体图像出现笔划粘连或模糊的问题。
本文通过结合条件生成式对抗网络(conditionalgenerative
adversarialnets,CGAN)
[12]
和 Wasserstein生 成 式 对 抗 网 络
(
WassersteinGAN)
[13]
来改进中文字形建模的方法。其中,生
成式模型是深度学习在计算机视觉领域中一个重要的研究热
第 36卷第 10期
2019年 10月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol36No10
Oct.2019