
大
规模知识图中不一致性解释的快速计算
陈忠健
博世人工智能中心
德国伦宁根
trungkien. de.bosch.com
穆罕默德
·H.
加德
-
埃拉布
博世人工智能中心
Renningen,德国
德国萨尔布吕肯
马克斯-普朗克信息
学研究所
gadelrab@mpi-
inf.mpg.de
达里娅
·
斯捷潘诺娃
博世人工智能中心
Renningen,德国
daria. de.bosch.com
叶夫根尼
·
哈拉莫夫
博世人工智能中心
Renningen,德国
evgeny. de.bosch.com
扬尼克·施特根
博世人工智能中心
Renningen,德国
jannik. de.bosch.com
知识图
知识图谱是
Web
搜索和问答等应用的重要资源由于知识库通常是
自动构建的,它们可能包含不正确的事实。探测它们是一项至关
重要但又极其昂贵的任务。 突出
的解决方案检测和解释
KG
中关于
描述感兴趣的
KG
域的伴随本体的不一致性
。与机器学习方法相比,
它们更可靠
,更易于人类解释,但在大型KG上的规模很小。
在这
ObjectPropertyRange
(
hasCustomer
,
Company
)
ObjectPropertyDomain
(
isCityOf
,
City
)
DisjointClasses(City,Company,Country)
论文中,我们提出了一种新的方法,大大加快检测和解释大型
KG
中的不一致性的过程中,利用
KG
抽象捕捉突出的数据模式。
尽管
KG
抽象要小得多,但它保留了不一致性
及其解释。我们对大
型
KG
的实验(例如,
DBpedia
和
Yago
)证明了我们的方法的可行
性,并表明
它显着优于流行的基线。
ACM
参考格式:
作者声明:
John H. Gad-Elrab
,
Daria Stepanova
,
Evgeny Khar-
lamov
,
and Jannik Strötgen. 2020.
大规模知识图中不一致性解释的快速计算 在
网
络会议
2020
(
WWW '20
)的会议记录,
2020
年
4
月
20
日至
24
日,台北,台
湾 。
ACM
, 美 国 纽 约 州
纽 约 市 , 7 页 。
https://doi.org/10.1145/3366423.3380014
1 介绍
动机知识图(
KG
)通过用类标记实体并经由二元关系将它们互
连来描述关于实体的事实例如,图
1
的顶部描绘了具有
关于公司和
位置的事实的KG,例如,
诺基亚
是一个
大众品牌
,
它是
IBM
的
客户。 大型知识库的突出例子包括
DBpedia [19]
、
NELL [23]
、
Yago [31]
、
Freebase [3]
和
Wiki-
data [34]--都包含数百万个事实。
KG为各种
重要的应用程序提供动力,包括
Web
搜索
[5]
和问题
本文在知识共享署名4.0国际
(CC-BY 4.0)许可下发布。作者保留在其个人和公
司网站上以适当的署名传播作品的权利
WWW
©
2020 IW 3C 2
(国际万维网大会委员会),
在知识共享
CC-BY 4.0
许可下发布。
ACM ISBN 978-1-4503-7023-3/20/04。
https://doi.org/10.1145/3366423.3380014
回答
[6]
。 虽然
KG
的数据质量对于这种应用
至关重要,但不幸的
是,大规模
KG
通常不准确。实际上,
它们是使用诸如信息提取
(例如,
Yago
)、众包(例如,
Wikidata
)或
使用基于嵌入的方法
(参见
[36]
的概述)。
这些方法不可避免地引入错误信息,例如,
错误地消除了实体的歧义或错误的关系。
在这种情况下,一个共同的任务是在幼儿园中
发现不正确
的事实
虽然关于这个主题的许多工作都集中
在机器学习技术上
(例如,
[15
,
27]
),依赖
于符号推理的方法(例如,[25,
32])由于其准确性和人类可解释性[26],已经显示出这项任
务的好处
用于检测
KG
中的不正确事实的一个突出的这样的方法
是计算KG相对于手动制作的本体的不一致解释[14],本体是
捕
获相关感兴趣域和强制执行某些语句不能一起出现的约束的公理
集。
在图1的底部呈现的示例本体指出,hasCustomer关系的范围
是
Company
,
isCityOf
关系的域
是City,并且类City、Company和
Country是不相交的。这种
本体通常是由领域专家精心创建的,
并且
KG
中的错误通常以
KG
中是否存在与伴随的本体相矛盾的三元
组为特征。
很容易验证我们的样本KG与本体相矛盾,因为丰
田和诺基亚属于不相交的类Company和City。导致这种情况的
最小
公理集是一种
不一致的解释
。
检测和解释用本体增强的KG中的不
一致性
是基本的和充分研究的知识管理任务
[13
,
26]
。众所周
知,找到所有甚至一些
解释需要计算,因此无法扩展