第 !! 卷"第 # 期 "
!"#$!!" %"$# "
计 算 机 工 程
&"'()*+,-./0.++,0./
""
$%&' 年 # 月
1)#2 $%&'
!人工智能及识别技术!
文章编号" !"""#$%&'#&"!'$"(#"&" M #"( ) ) ) 文献标志码" *) ) ) 中 图 分 类 号 " +,!'
基金项目"国家科技支撑计划项目$$%&,M>K%&L%$% '
作者简介"鲍开放$&(($)% &男 &硕士研究生&主研方向为自然语言处理(顾君忠&教 授 #博 士 生 导 师 (杨"静&副教授'
收稿日期"$%%)5&! " " 修 回 日 期 "$%&# 5%#5$,""/#0123",&&,&$%&%$* + 8*)$+9.)$+H)$9.
基于结构与文本联合表示的知识图谱补全方法
鲍开放!顾君忠!杨"静
$ 华东师范大学 计算机科学技术系&上海 $%%%)$%
摘"要" 现有的表示学习算法不能很好地表示知识图谱中的复杂关系&且未能充分利用实体的描述文本' 为此&建
立一种结合文本表示和结构表示的联合表示学 习 模 型' 使 用深度卷 积 神 经 网 络 对实体的 描 述 文 本 进 行编码得 到
文本表示&通过引入非对称映射操作的基于翻译思想的 模 型 生 成 结 构表示&将两者进 行 联 合 学 习 从而得到 实 体 和
关系表示&同时使用不同的低秩矩阵分别对头实体和尾实体进行映射&使其能更好 地表现 知识图 谱中的 复杂关 系'
实验结果表明&相对文本表示和结构表示的单独训练模型&该模型具有更好的表示性能'
关键词" 知识图谱补全(表示学习(深度学习(词向量(知识表示
中文引用格式"鲍开放&顾君忠&杨"静$基于结构与文本联合表示的知识图谱补全方法*1+$计算机工程&$%&'&!!$#% ,
$%,5$&&$
英文引用格式" M>P 360G6./& A; 1).FE"./& V>%A 10./$3."Q#+H/+ /,6(E 9"'(#+*0". '+*E"H N68+H ". 7"0.*#2
,+(,+8+.*6*0". "G8*,)9*),+6.H *+R** 1+ $&"'()*+,-./0.++,0./&$%&'&!!$#% ,$%,5$&&$
H;:J35BC5N71=9F:0=35>2:;R5>9:BT165B:;
d:2;>3I 45=7565;>1>2:;:@Y>7E8>E751;B+5]>
M>P 360G6./&A; 1).FE"./&V>%A 10./
$ =+(6,*'+.*"G&"'()*+,I90+.9+6.H ?+9E."#"/2&-68*&E0.6%",'6#;.0O+,80*2&IE6./E60$%%%)$&&E0. 6%
- *G6>718>. ?E++R08*0./ ,+(,+8+.*6*0". #+6,.0./ 6#/",0*E'896. ."*Q+##,+(,+8+.**E+9"'(#+R ,+#6*0".8E0( 0. T."Q#+H/+
/,6(E&6.H G60#8*" '6T+G)##)8+"G*E+H+89,0(*0". *+R*"G+.*0*0+8$?" 8"#O+*E08(,"N#+'&*E08(6(+,(,"("8+867"0.*#2
,+(,+8+.*6*0". #+6,.0./ '"H+#9"'N 0.0./ *+R*,+(,+8+.*6*0". 6.H 8*,)9*),+,+(,+8+.*6*0".$?E+H++( &".O"#)*0". %+),6#
%+*Q",T$ &%%% 08)8+H *" +.9"H+*E+*+R*"G*E++.*0*2 *" /+**E+*+R*,+(,+8+.*6*0".& *E+8*,)9*),+,+(,+8+.*6*0". 08
/+.+,6*+H N2 0.*," H)90./ *E+*,6.8#6*0". *E")/E*'"H+#"G682''+*,09'6((0./ "(+,6*0".&6.H *E+*Q" 6,+7"0.*#2 8*)H0+H
*" /+*+.*0*2 6.H ,+#6*0". ,+(,+8+.*6*0".$>**E+86'+*0'+&H0GG+,+.*#"Q5,6.T '6*,09+808)8+H *" (,"7+9**E+E+6H +.*0*2
6.H *E+*60#+.*0*2 8+(6,6*+#2&8" *E6**E+(,"("8+H '"H+#96. N+**+,+R(,+88*E+9"'(#+R ,+#6*0".8E0( 0. T."Q#+H/+/,6(E$
-R(+,0'+.*6#,+8)#*88E"Q *E6**E+(,"("8+H '"H+#E68N+**+,,+(,+8+.*6*0". 6N0#0*2 *E6. *E+80./#+*,60.0./ '"H+#"G*+R*
,+(,+8+.*6*0". 6.H 8*,)9*),+,+(,+8+.*6*0".$
- H5I J:7B6. T."Q#+H/+/,6(E 9"'(#+*0".(,+(,+8+.*6*0". #+6,.0./(H++( #+6,.0./(Q",H O+9*",(T."Q#+H/+,+(,+8+.*6*0".
K<L,&%$&()#' S7$088.$&%%% 5*!$'$%%!#,('
")概述
以 L,++N68+和 B",H%+*为代表的知 识图谱因能
够提供准确#有 效 的 结 构 信 息&已 成 为 网 络 检 索# 推
荐系统和 自 动 问 答 系 统 等 智 能 应 用 的 重 要 数 据 资
源
*&+
' 知识图谱往往包含数以百万计的 实体和数 十
亿条的知识&但 在 实 际 应 用 中 还不 够 全 面' 知 识 图
谱补全旨在解决知识图谱中的数据稀疏问 题
*$+
' 例
如&由! Y)++. -#0F6N+*E <<&1(#69+1"G1N0,*E&C".H"."
和! C".H".&196(0*6#1"G&;.0*+H130./H"'" $ 条 知 识&
可以 推 断 ! Y)++. -#0F6N+*E <<& .6*0".6#0*2& ;.0*+H 1
30./H"'" 很可能是 一条潜在知 识' 因 此&无 需 从外
部信息中抽取 新 的 关 系 数 据& 仅 利 用 知 识 图 谱 中 已
有的数据就可以挖掘出一些新关系'
知识图 谱 常 以 网 络 形 式 表 示 & 其 中 & 节 点 代 表
实体&边代表 $ 个 实 体 间 的 关 系&每 一 条 知 识 用 三
元组 $ <&%&!% 形 式表示 &其 中&< 表 示 头 实 体&%表 示
关系 &!表示 尾实体 ' 类似三元组的 符 号 表示 方 法&
要求在 知识图 谱 补 全 中 必 须 为 不 同 的 应 用 设 计 不
同的图 算法' 随着知 识图谱 规 模 的 不 断 增加&由于