TransE表示学习方法深度综述：最新进展与前景

5星 · 超过95%的资源需积分: 21 10 浏览量更新于2024-08-13 收藏 1.3MB PDF 举报

本文综述了基于TransE的表示学习方法的研究进展，这是一种在知识图谱领域广泛应用的模型，用于学习实体和关系的低维表示，以便更好地理解和处理复杂的数据结构。TransE模型是这类方法的基础，它假设实体和关系之间的关系可以通过简单的加法运算来表达，这简化了模型的训练过程。文章首先将基于TransE的表示学习方法划分为四个类别：复杂关系、关系路径、图像信息和其他方向。复杂关系方法关注于处理多样的、非线性的关系；关系路径方法则利用路径信息增强表示学习；图像信息方法将视觉特征融入图谱表示；其他方向可能包括结合了多种技术的混合方法。对于每种方法，作者详细分析了它们的设计思路、优点和局限性。例如，PaSKoGE（Path-aware Subgraph Knowledge Embedding）可能在考虑关系路径上下文中表现优异，而NTransGH（Neural Transitive Graph Hypernetworks）可能利用了神经网络的灵活性。TCE（Triple Context Embedding）和TransD则分别通过考虑三元组上下文和动态构造映射矩阵来提升性能。文章还对比了基于TransE的不同表示学习方法在链接预测和三元组分类任务上的表现，其中PaSKoGE、NTransGH、TCE和TransD在这些任务上表现出色，显示出它们在知识图谱建模和推理方面的有效性。然而，作者指出这些方法还有改进的空间，特别是在路径特定的嵌入、多层神经网络结构、利用三元组上下文信息以及动态调整映射策略等方面。此外，文章讨论了公共数据集和评价指标的选择，这对于评估不同方法的性能至关重要。常用的公共数据集包括WN18、FB15k等，而评价指标如MRR（Mean Reciprocal Rank）、Hits@K等被用来衡量模型的准确性和效率。这篇综述为研究者提供了关于基于TransE表示学习方法的全面理解，强调了当前最佳实践，并为未来研究提出了可能的发展方向。通过对现有工作的深入分析，该文有助于推动知识图谱领域的技术创新和应用。

收稿日期：２０２００２２８；修回日期：２０２００４０７　　基金项目：国家自然科学基金资助项目（６１９６６０３５）；新疆维吾尔自治区智能多模态信息

处理团队资助项目（ＸＪＥＤＵ２０１７Ｔ００２）；新疆维吾尔自治区研究生创新项目（ＸＪ２０１９Ｇ０７２）

作者简介：张正航（１９９３），男，湖北孝感人，硕士研究生，主要研究方向为知识图谱和知识表示；钱育蓉（１９８０），女（满族）（通信作者），教授，

博士，主要研究方向为网络计算和遥感图像处理（ｑｙｒ＠ｘｊｕ．ｅｄｕ．ｃｎ）；行艳妮（１９９４），女，陕西渭南人，硕士研究生，主要研究方向为数据挖掘；赵鑫

（１９９４），男，河南新乡人，硕士研究生，主要研究方向为数据挖掘．

基于ＴｒａｎｓＥ的表示学习方法研究综述



张正航

ａ，ｂ

，钱育蓉

ａ，ｂ

，行艳妮

ａ，ｂ

，赵　鑫

ａ，ｂ

（新疆大学ａ．软件学院；ｂ．新疆维吾尔自治区信号检测与处理重点实验室，乌鲁木齐８３００４６）

摘　要：为了及时了解基于ＴｒａｎｓＥ的表示学习方法的最新研究进展，通过归纳与整理，将基于ＴｒａｎｓＥ的表示学

习方法分为基于复杂关系、基于关系路径、基于图像信息以及基于其他方面的方法四种类型。对每一种方法的

设计思路、优缺点等进行了详细的分析，同时对基于

ＴｒａｎｓＥ的表示学习方法的公共数据集与评价指标进行了对

比、总结，对各种基于

ＴｒａｎｓＥ的表示学习算法在实验中的表现进行了对比分析。从研究结果来看，ＰａＳＫｏＧＥ、

ＮＴｒａｎｓＧＨ、ＴＣＥ、ＴｒａｎｓＤ方法在进行链接预测和三元组分类任务上表现效果最好，值得推广和进一步拓展，并可

在其特定于路径的嵌入、两层神经网络、三元组上下文、动态构造映射矩阵上进一步完善。

关键词：知识图谱；表示学习；ＴｒａｎｓＥ模型；知识图谱嵌入；翻译模型

中图分类号：ＴＰ３９１　　　文献标志码：Ａ　　　文章编号：１００１３６９５（２０２１）０３００３０６５６０８

ｄｏｉ：１０．１９７３４／ｊ．ｉｓｓｎ．１００１３６９５．２０２０．０２．００２８

ＳｕｒｖｅｙｏｆｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇｍｅｔｈｏｄｓｂａｓｅｄｏｎＴｒａｎｓＥ

ＺｈａｎｇＺｈｅｎｇｈａｎｇ

ａ，ｂ

，ＱｉａｎＹｕｒｏｎｇ

ａ，ｂ

，ＸｉｎｇＹａｎｎｉ

ａ，ｂ

，ＺｈａｏＸｉｎ

ａ，ｂ

（ａ．ＣｏｌｌｅｇｅｏｆＳｏｆｔｗａｒｅ，ｂ．ＫｅｙＬａｂｏｒａｔｏｒｙｏｆＳｉｇｎａｌＤｅｔｅｃｔｉｏｎ＆ＰｒｏｃｅｓｓｉｎｇｉｎＸｉｎｊｉａｎｇＵｙｇｕｒＡｕｔｏｎｏｍｏｕｓＲｅｇｉｏｎ，ＸｉｎｊｉａｎｇＵｎｉｖｅｒｓｉｔｙ，

Ｕｒｕｍｑｉ８３００４６，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：ＩｎｏｒｄｅｒｔｏｕｎｄｅｒｓｔａｎｄｔｈｅｌａｔｅｓｔｒｅｓｅａｒｃｈｐｒｏｇｒｅｓｓｏｆＴｒａｎｓＥｂａｓｅｄｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇｍｅｔｈｏｄｓｉｎｒｅａｌｔｉｍｅ，ｔｈｉｓ

ｐａｐｅｒｃｌａｓｓｉｆｉｅｄＴｒａｎｓＥｂａｓｅｄｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇｍｅｔｈｏｄｓｉｎｔｏｆｏｕｒｔｙｐｅｓ

：ｔｈｅｍｅｔｈｏｄｂａｓｅｄｏｎｃｏｍｐｌｅｘｒｅｌａｔｉｏｎｓｈｉｐ，ｔｈｅ

ｍｅｔｈｏｄｂａｓｅｄｏｎｒｅｌａｔｉｏｎｓｈｉｐｐａｔｈ，ｔｈｅｍｅｔｈｏｄｂａｓｅｄｏｎｉｍａｇｅｉｎｆｏｒｍａｔｉｏｎ，ａｎｄｔｈｅｍｅｔｈｏｄｂａｓｅｄｏｎｏｔｈｅｒａｓｐｅｃｔｓ．Ｔｈｅｎ，ｔｈｉｓ

ｐａｐｅｒａｎａｌｙｚｅｄｔｈｅｄｅｓｉｇｎｉｄｅａｓ，ａｄｖａｎｔａｇｅｓａｎｄｄｉｓａｄｖａｎｔａｇｅｓｏｆｅａｃｈｍｅｔｈｏｄ．Ａｔｔｈｅｓａｍｅｔｉｍｅ，ｉｔｃｏｍｐａｒｅｄａｎｄｓｕｍｍａｒｉｚｅｄ

ｔｈｅｃｏｍｍｏｎｄａｔａｓｅｔｓａｎｄｅｖａｌｕａｔｉｏｎｉｎｄｅｘｅｓｏｆｔｈｅＴｒａｎｓＥｂａｓｅｄｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇｍｅｔｈｏｄ

，ａｓｗｅｌｌａｓｔｈｅｐｅｒｆｏｒｍａｎｃｅｏｆ

ｖａｒｉｏｕｓＴｒａｎｓＥｂａｓｅｄｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇａｌｇｏｒｉｔｈｍｓｉｎｔｈｅｅｘｐｅｒｉｍｅｎｔ．Ｆｒｏｍｔｈｅｒｅｓｅａｒｃｈｒｅｓｕｌｔｓ

，ＰａＳＫｏＧＥ，ＮＴｒａｎｓＧＨ，

ＴＣＥａｎｄＴｒａｎｓＤｍｅｔｈｏｄｐｅｒｆｏｒｍｔｈｅｂｅｓｔｉｎｌｉｎｋｐｒｅｄｉｃｔｉｏｎａｎｄｔｒｉｐｌｅｃｌａｓｓｉｆｉｃａｔｉｏｎｔａｓｋｓ，ｗｈｉｃｈａｒｅｗｏｒｔｈｐｒｏｍｏｔｉｎｇａｎｄｆｕｒ

ｔｈｅｒｅｘｐａｎｄｉｎｇ

，ａｎｄｃａｎｂｅｆｕｒｔｈｅｒｉｍｐｒｏｖｅｄｉｎｐａｔｈｓｐｅｃｉｆｉｃｅｍｂｅｄｄｉｎｇ，ｔｗｏｌａｙｅｒｎｅｕｒａｌｎｅｔｗｏｒｋ，ｔｒｉｐｌｅｃｏｎｔｅｘｔａｎｄｄｙｎａｍｉｃ

ｍａｐｐｉｎｇｍａｔｒｉｘｃｏｎｓｔｒｕｃｔｉｏｎ．

Ｋｅｙｗｏｒｄｓ：ｋｎｏｗｌｅｄｇｅｇｒａｐｈ（ＫＧ）；ｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎｉｎｇ；ＴｒａｎｓＥｍｏｄｅｌ；ｋｎｏｗｌｅｄｇｅｇｒａｐｈｅｍｂｅｄｄｉｎｇ（ＫＧＥ）；ｔｒａｎｓｌａ

ｔｉｏｎｍｏｄｅｌ

０　引言

近年来，受到词向量模型的启发，以翻译模型为代表的表

示学习在知识图谱（ＫＧ）领域越来越受到人们的关注。知识表

示指的是通过将符号化的三元组（ｈ，ｒ，ｔ）映射到低维稠密的向

量空间，便于实体与关系之间的计算

［１～３］

。在这种向量空间

中，通过计算实体（关系）对象间的距离从而推理出实体（关

系）对象的语义相似度，能够高效解决数据稀疏的难题，使得

知识获取和知识推理变得更加容易与精准

［４，５］

。同时，知识表

示学习的研究能够服务于实体对齐、事件抽取以及问答系统等

应用中，拥有非常广阔的前景

［６］

。

考虑到知识表示的广泛应用前景，研究人员相继提出了很

多的知识表示模型，如距离模型（

ｓｔｒｕｃｔｕｒｅｄｅｍｂｅｄｄｉｎｇ，ＳＥ）、单

层神经网络模型（ｓｉｎｇｌｅｌａｙｅｒｍｏｄｅｌ，ＳＬＭ）、语义能量匹配模型

（ｓｅｍａｎｔｉｃｍａｔｃｈｉｎｇｅｎｅｒｇｙ，ＳＭＥ）、张量分解模型、基于翻译的

模型等

［７］

。在这些经典方法中，以ＴｒａｎｓＥ

［８］

为代表的翻译模

型最受到人们的重视，成为当下研究的热点。

ＴｒａｎｓＥ模型是

Ｂｏｒｄｅｓ在２０１３年提出来的，这种方法在链接预测方面表现出

了很好的效果，并且这种方法参数少、操作简单；但是

ＴｒａｎｓＥ

方法在处理复杂关系时存在准确度不高的问题，例如在处理一

对多、多对一、多对多和自反等复杂关系时，ＴｒａｎｓＥ方法不能精

准推算出具有相同关系的实体

［９～１１］

。

ＴｒａｎｓＥ方法优化问题一直都是学者们争相研究的热门话

题，每年都会有许多新奇的模型出现

［１２～１５］

。本文以ＴｒａｎｓＥ方

法存在的问题为分类原则，将基于ＴｒａｎｓＥ的表示学习方法的

综述文献分为四类：ａ）基于复杂关系的方法，如ＳＴｒａｎｓＨ、

ＴｒａｎｓＤ、ＮＴｒａｎｓＧＨ、ＴｒａｎｓＧｒａｐｈ、ＴｒａｎｓＡＨ

［１６～１８］

；ｂ）基于关系路

径的方法，如ＰＴｒａｎｓＥ、ＰａＳＫｏＧＥ

［１９，２０］

；ｃ）基于图像信息的方

法，如ＩＴＭＥＡ、ＴＣＥ

［２１，２２］

；ｄ）其他方面的方法

［２３～２５］

，如Ｔｒａｎｓ

ＲＤ

［２６］

、ＴｒａｎｓＥＳＮＳ

［２７］

、ＡＳＴ＿ＮＺＬ

［２８］

、ＧＴｒａｎｓ

［２９］

。与其他知识

表示综述相比：ａ）本文对基于ＴｒａｎｓＥ的表示学习方法的算法思

想、优缺点进行了介绍，并对其进行了较为全面、合理的分类与

总结

［３０，３１］

；ｂ）对ＴｒａｎｓＥ表示学习方法存在的问题进行了较为细

致的分析与概述；

ｃ）对基于ＴｒａｎｓＥ的表示学习算法常用的实验

数据集、算法性能评价指标进行了分析与总结；对每类问题中算

法的主要指标进行了对比分析，并找出了可以继续推广和扩展

的方法

［３２］

；ｄ）分析并总结了基于ＴｒａｎｓＥ的表示学习算法中当

第３８卷第３期

２０２１年３月　

计算机应用研究

ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓ

Ｖｏｌ３８Ｎｏ３

Ｍａｒ．２０２１

下载后可阅读完整内容，剩余7页未读，立即下载

weixin_38635449

粉丝: 5
资源: 971

TransE表示学习方法深度综述：最新进展与前景

TransE:重新实现TransE模式

TransE算法代码实现.rar

知识图谱构建技术综述PPT

知识表示学习：量化综述

知识图谱完成：现状与技术综述

知识表示与构建：驱动AI的核心技术

知识图谱嵌入技术：现状、方法与应用

基于知识图谱的推荐系统算法与实践

工具变量城市供应链创新试点数据（2007-2023年）.xlsx

基于Python django-simpleui开发的博客系统详细文档+资料齐全.zip

最新资源