收稿日期:20200228;修回日期:20200407 基金项目:国家自然科学基金资助项目(61966035);新疆维吾尔自治区智能多模态信息
处理团队资助项目(XJEDU2017T002);新疆维吾尔自治区研究生创新项目(XJ2019G072)
作者简介:张正航(1993),男,湖北孝感人,硕士研究生,主要研究方向为知识图谱和知识表示;钱育蓉(1980),女(满族)(通信作者),教授,
博士,主要研究方向为网络计算和遥感图像处理(qyr@xju.edu.cn);行艳妮(1994),女,陕西渭南人,硕士研究生,主要研究方向为数据挖掘;赵鑫
(1994),男,河南新乡人,硕士研究生,主要研究方向为数据挖掘.
基于 TransE的表示学习方法研究综述
张正航
a,b
,钱育蓉
a,b
,行艳妮
a,b
,赵 鑫
a,b
(新疆大学 a.软件学院;b.新疆维吾尔自治区信号检测与处理重点实验室,乌鲁木齐 830046)
摘 要:为了及时了解基于 TransE的表示学习方法的最新研究进展,通过归纳与整理,将基于 TransE的表示学
习方法分为基于复杂关系、基于关系路径、基于图像信息以及基于其他方面的方法四种类型。对每一种方法的
设计思路、优缺点等进行了详细的分析,同时对基于
TransE的表示学习方法的公共数据集与评价指标进行了对
比、总结,对各种基于
TransE的表示学习算法在实验中的表现进行了对比分析。从研究结果来看,PaSKoGE、
NTransGH、TCE、TransD方法在进行链接预测和三元组分类任务上表现效果最好,值得推广和进一步拓展,并可
在其特定于路径的嵌入、两层神经网络、三元组上下文、动态构造映射矩阵上进一步完善。
关键词:知识图谱;表示学习;TransE模型;知识图谱嵌入;翻译模型
中图分类号:TP391 文献标志码:A 文章编号:10013695(2021)03003065608
doi:10.19734/j.issn.10013695.2020.02.0028
SurveyofrepresentationlearningmethodsbasedonTransE
ZhangZhenghang
a,b
,QianYurong
a,b
,XingYanni
a,b
,ZhaoXin
a,b
(a.CollegeofSoftware, b.KeyLaboratoryofSignalDetection& ProcessinginXinjiangUygurAutonomousRegion, XinjiangUniversity,
Urumqi830046,China)
Abstract:InordertounderstandthelatestresearchprogressofTransEbasedrepresentationlearningmethodsinrealtime,this
paperclassifiedTransEbasedrepresentationlearningmethodsintofourtypes
:themethodbasedoncomplexrelationship,the
methodbasedonrelationshippath,themethodbasedonimageinformation,andthemethodbasedonotheraspects.Then,this
paperanalyzedthedesignideas,advantagesanddisadvantagesofeachmethod.Atthesametime,itcomparedandsummarized
thecommondatasetsandevaluationindexesoftheTransEbasedrepresentationlearningmethod
,aswellastheperformanceof
variousTransEbasedrepresentationlearningalgorithmsintheexperiment.From theresearchresults
,PaSKoGE,NTransGH,
TCEandTransDmethodperformthebestinlinkpredictionandtripleclassificationtasks,whichareworthpromotingandfur
therexpanding
,andcanbefurtherimprovedinpathspecificembedding,twolayerneuralnetwork,triplecontextanddynamic
mappingmatrixconstruction.
Keywords:knowledgegraph(KG);representationlearning;TransEmodel;knowledgegraphembedding(KGE);transla
tionmodel
0 引言
近年来,受到词向量模型的启发,以翻译模型为代表的表
示学习在知识图谱(KG)领域越来越受到人们的关注。知识表
示指的是通过将符号化的三元组(h,r,t)映射到低维稠密的向
量空间,便于实体与关系之间的计算
[1~3]
。在这种向量空间
中,通过计算实体(关系)对象间的距离从而推理出实体(关
系)对象的语义相似度,能够高效解决数据稀疏的难题,使得
知识获取和知识推理变得更加容易与精准
[4,5]
。同时,知识表
示学习的研究能够服务于实体对齐、事件抽取以及问答系统等
应用中,拥有非常广阔的前景
[6]
。
考虑到知识表示的广泛应用前景,研究人员相继提出了很
多的知识表示模型,如距离模型(
structuredembedding,SE)、单
层神经网络模型(singlelayermodel,SLM)、语义能量匹配模型
(semanticmatchingenergy,SME)、张量分解模型、基于翻译的
模型等
[7]
。在这些经典方法中,以 TransE
[8]
为代表的翻译模
型最受到人们的重视,成为当下研究的热点。
TransE模型是
Bordes在 2013年提出来的,这种方法在链接预测方面表现出
了很好的效果,并且这种方法参数少、操作简单;但是
TransE
方法在处理复杂关系时存在准确度不高的问题,例如在处理一
对多、多对一、多对多和自反等复杂关系时,TransE方法不能精
准推算出具有相同关系的实体
[9~11]
。
TransE方法优化问题一直都是学者们争相研究的热门话
题,每年都会有许多新奇的模型出现
[12~15]
。本文以 TransE方
法存在的问题为分类原则,将基于 TransE的表示学习方法的
综述 文 献 分 为 四 类:a)基 于 复 杂 关 系 的 方 法,如 STransH、
TransD、NTransGH、TransGraph、TransAH
[16~18]
;b)基 于 关 系 路
径的方 法,如 PTransE、PaSKoGE
[19,20]
;c)基 于 图 像 信 息的 方
法,如 ITMEA、TCE
[21,22]
;d)其他方面的方法
[23~25]
,如 Trans
RD
[26]
、TransESNS
[27]
、AST_NZL
[28]
、GTrans
[29]
。与其他知识
表示综述相比:a)本文对基于 TransE的表示学习方法的算法思
想、优缺点进行了介绍,并对其进行了较为全面、合理的分类与
总结
[30,31]
;b)对 TransE表示学习方法存在的问题进行了较为细
致的分析与概述;
c)对基于 TransE的表示学习算法常用的实验
数据集、算法性能评价指标进行了分析与总结;对每类问题中算
法的主要指标进行了对比分析,并找出了可以继续推广和扩展
的方法
[32]
;d)分析并总结了基于 TransE的表示学习算法中当
第 38卷第 3期
2021年 3月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol38No3
Mar.2021