![](https://csdnimg.cn/release/download_crawler_static/87486796/bg3.jpg)
知识图谱链路预测的性能取决于模型对图数据结构和关系模式建模的契合程度。双曲
空间是最近机器学习领域中十分活跃的研究热点之一,已有研究表明,在建模多关系树形
层次结构的知识图谱数据时,负常数曲率空间即双曲空间要优于零曲率空间即欧式空间
[18]
。近年来,许多研究尝试把各种各样的层级数据嵌入到双曲空间,在嵌入向量维度更少
的条件下却在下游的机器学习任务中取得了更好的效果,并在知识问答、机器翻译、图分
析等应用上取得了性能上的提升。Zhang 等人
[19]
通过双曲层级注意力网络模型 Hype-HAN
生成从词向量到句向量,再到最终的文档向量,然后利用生成的这些语义向量用于自动文
本分类任务。Balaževic 等人
[20]
提出的 MuRP 模型在双曲几何空间中学习知识图谱表示向
量,通过最小化头实体向量和尾实体向量转移后的双曲距离,学习到最佳双曲嵌入式向
量,但是其缺点在于它像其他转移距离模型一样无法挖掘关系中的逻辑属性,且模型曲率
固定会导致准确率的丧失。针对此问题,Chami 等人
[21]
提出 ATTH 模型对其进行改进,使
用旋转、反射、平移变换对知识图谱中的逻辑和层次模式进行建模,取得了更佳的预测效
果。
3. 相关概念及定义
3.1 知识图谱链路预测
知识图谱可以看作用多关系图
\boldsymbolG=(\boldsymbolV,\boldsymbolR)\boldsymbolG=(\boldsymbolV,\boldsymbolR)
来表示知识三元组集合,其中\boldsymbolV\boldsymbolV 和\boldsymbolR\boldsymbolR
分别表示实体(节点)和关系(边)集合,知识三元组
(vh,rh,t,vt)∈\boldsymbolE⊆\boldsymbolV×\boldsymbolR×\boldsymbolV(vh,rh,t,vt)∈
\boldsymbolE⊆\boldsymbolV×\boldsymbolR×\boldsymbolV 表示包含语义信息的事实,且其
中 vh∈\boldsymbolVvh∈\boldsymbolV 是头实体,vt∈\boldsymbolVvt∈\boldsymbolV 是
尾实体,rh,t∈\boldsymbolRrh,t∈\boldsymbolR 是两者之间的语义关系。知识表示学习的
目的就是在某个空间 UU 中将实体 vh,vt∈\boldsymbolVvh,vt∈\boldsymbolV 映射成向量
\boldsymbolvh,\boldsymbolvt∈UdV\boldsymbolvh,\boldsymbolvt∈UdV,将关系
rh,t∈\boldsymbolRrh,t∈\boldsymbolR 映射成向量\boldsymbolrh,t∈UdR\boldsymbolrh,t∈
UdR,学习到的向量可以保留知识图谱的结构和语义信息。由于知识图谱经常是不完备
的,所以需要链路预测来推断其他的正确事实。如果数据集被划分为训练集三元组集合
\boldsymbolETrain\boldsymbolETrain 和测试集三元组集合
\boldsymbolETest\boldsymbolETest,知识图谱上的表示向量学习过程如下:定义一个用于
衡量三元组成立可能性的得分函数
f:\boldsymbolV×\boldsymbolR×\boldsymbolV→Rf:\boldsymbolV×\boldsymbolR×\boldsym
bolV→R,使用训练集\boldsymbolETrain\boldsymbolETrain 中的知识三元组训练,用学习
到的表示向量计算测试集\boldsymbolETest\boldsymbolETest 中的知识三元组得分,目标是
使得测试集中真实存在的三元组得分大于不存在的三元组得分。