第 44 卷 第 11 期 自 动 化 学 报 Vol. 44, No. 11
2018 年 11 月 ACTA AUTOMATICA SINICA November, 2018
一种基于深度学习的青铜器铭文识别方法
李文英
1
曹 斌
1
曹春水
2, 3
黄永祯
2, 3
摘 要 考古出土的青铜器铭文是非常宝贵的文字材料, 准确、快速地了解其释义和字形演变源流对考古学、历史学和语言学
研究均有重要意义. 青铜器铭文的辨识需要综合文字的形、音、义进行研究, 其中第一步也是最重要的一步就是分析文字的形
体特征. 本文提出一种基于两阶段特征映射的神经网络模型来提取每个文字的形体特征, 最后对比目前已知的文字研究成果,
如《古文字类编》、《说文解字》, 得出识别的结果. 通过定性和定量的实验分析, 我们发现本文提出的方法可达到较高的识别
精度. 特别地, 在前 10 个预测类别中 (Top-10) 准确率达到了 94.2 %, 大幅缩小了考古研究者的搜索推测空间, 提高了青铜铭
文识别的效率和准确性.
关键词 模式识别, 青铜器铭文, 文字识别, 深度学习, 深度卷积神经网络
引用格式 李文英, 曹斌, 曹春水, 黄永祯. 一种基于深度学习的青铜器铭文识别方法. 自动化学报, 2018, 44(11): 2023−2030
DOI 10.16383/j.aas.2018.c180152
A Deep Learning Based Method for Bronze Inscription Recognition
LI Wen-Ying
1
CAO Bin
1
CAO Chun-Shui
2, 3
HUANG Yong-Zhen
2, 3
Abstract Bronze inscriptions from archaeology are very valuable text materials. Accurate and rapid understanding of
their meaning and shape evolution is important for archeology, history and linguistics. It is necessary to combine characters
shap e, phonology and meaning for recognition of bronze inscription, wherein the first and also the most important step
is to analyze shapes of bronze inscriptions. In this paper, we present a bronze inscription analysis method based on
convolutional neural network (CNN) with two-phase feature mapping. We first extract the bronze inscriptions by image
acquisition, and then, by comparing with the currently known character research results, e. g., “Ancient Chinese Character
Type Series” and “Shuo Wen Jie Zi”, we obtain the recognition results. Through qualitative and quantitative experimental
analyses, we find that the proposed method achieves high recognition accuracy. Specifically, we achieve 94.2 % accuracy
for the Top-10, greatly reducing the space of archaeological search and improving the efficiency and accuracy of bronze
inscription recognition.
Key words Pattern recognition, bronze inscription, character recognition, deep learning, convolutional neural network
(CNN)
Citation Li Wen-Ying, Cao Bin, Cao Chun-Shui, Huang Yong-Zhen. A deep learning based method for bronze inscrip-
tion recognition. Acta Automatica Sinica, 2018, 44(11): 2023−2030
青铜器是商周时代社会祭祀和战争的主要工具,
通过对青铜器的造型、工艺、纹饰、铭文等的研究,
可以深入了解古代社会的政治经济文化. 其中, 铸有
收稿日期 2018-03-19 录用日期 2018-04-04
Manuscript received March 19, 2018; accepted April 4, 2018
国家重点基础研究发展计划 973 计划 (2016YFB1001000), 国家自然
科学基金 (61525306, 61633021, 61420106015), 教育部人文社会科学
研究青年基金项目 (18YJC780001) 资助
Supported by National Basic Research Program of China (973
Program) (2016YFB1001000), National Natural Science Foun-
dation of China (61525306, 61633021, 61420106015), and Hu-
manities and Social Sciences Research Youth Fund Project, Min-
istry of Education (18YJC780001)
本文责任编委 刘成林
Recommended by Associate Editor LIU Cheng-Lin
1. 中国人民大学历史学院 北京 100872 2. 中国科学院自动化研究
所模式识别国家重点实验室 北京 100190 3. 银河水滴科技 (北京) 有
限公司 北京 100190
1. School of History, Renmin University of China, Beijing
100872 2. National Laboratory of Pattern Recognition, In-
stitute of Automation, Chinese Academy of Sciences, Beijing
100190 3. Watrix Technology Co. Ltd., Beijing 100190
铭文的青铜器, 因其遗留了古文字材料, 更是古文字
学、语言学、考古学及古代史研究的重要研究对象.
目前保存的青铜器中, 铸有铭文的有上万件
[1]
, 其中
西周至春秋时期, 可供研究的古文字材料主要都是
青铜器铭文, 可见青铜器铭文无论从其本身的古文
字学意义, 还是其所著述的内容而言, 都具有极大的
研究价值. 释读古文字, 一般先识其形, 通其音, 然
后识其义
[2]
. 古文字形体笔画复杂, 变化繁多, 且古
文字是不统一的, 各地方各时代都有不同的写法, 想
要释读古文字, 须得熟知古文字最初的形状, 如象形
字、形声字、假借字, 以及指事、会意、转注等构字
方法
[3]
, 还须参证甲骨文、战国文字, 熟读《说文解
字》等这种古文字字典, 难度很大, 有学者甚至将其
归之为 “绝学以内”. 简而言之, 释读青铜器铭文要
求研究者具有广博的知识基础和训练, 是一项极具
挑战的任务.
随着计算机技术特别是图像识别技术的高速发