没有合适的资源?快使用搜索试试~ 我知道了~
2613大规模知识图中不一致性解释的快速计算陈忠健博世人工智能中心德国伦宁根trungkien. de.bosch.com穆罕默德·H. 加德-埃拉布博世人工智能中心Renningen,德国德国萨尔布吕肯马克斯-普朗克信息学研究所gadelrab@mpi-inf.mpg.de达里娅·斯捷潘诺娃博世人工智能中心Renningen,德国daria. de.bosch.com摘要叶夫根尼·哈拉莫夫博世人工智能中心Renningen,德国evgeny. de.bosch.com扬尼克·施特根博世人工智能中心Renningen,德国jannik. de.bosch.com知识图知识图谱是Web搜索和问答等应用的重要资源由于知识库通常是自动构建的,它们可能包含不正确的事实。探测它们是一项至关重要但又极其昂贵的任务。 突出的解决方案检测和解释KG中关于描述感兴趣的KG域的伴随本体的不一致性。与机器学习方法相比,它们更可靠,更易于人类解释,但在大型KG上的规模很小。在这本体ObjectPropertyRange(hasCustomer,Company)ObjectPropertyDomain(isCityOf,City)DisjointClasses(City,Company,Country)图1:一个KG和本体的例子。论文中,我们提出了一种新的方法,大大加快检测和解释大型KG中的不一致性的过程中,利用KG抽象捕捉突出的数据模式。尽管KG抽象要小得多,但它保留了不一致性及其解释。我们对大型KG的实验(例如,DBpedia和Yago)证明了我们的方法的可行性,并表明它显着优于流行的基线。ACM参考格式:作者声明:John H. Gad-Elrab,Daria Stepanova,Evgeny Khar-lamov,and Jannik Strötgen. 2020.大规模知识图中不一致性解释的快速计算 在网络会议2020(WWW '20)的会议记录,2020年4月20日至24日,台北,台湾。ACM,美国纽约州纽约市,7页。https://doi.org/10.1145/3366423.33800141介绍动机知识图(KG)通过用类标记实体并经由二元关系将它们互连来描述关于实体的事实例如,图1的顶部描绘了具有关于公司和位置的事实的KG,例如, 诺基亚是一个大众品牌,它是IBM的客户。 大型知识库的突出例子包括DBpedia [19]、NELL [23]、Yago [31]、Freebase [3]和Wiki-data [34]--都包含数百万个事实。KG为各种重要的应用程序提供动力,包括Web搜索[5]和问题本文在知识共享署名4.0国际(CC-BY 4.0)许可下发布。作者保留在其个人和公司网站上以适当的署名传播作品的权利WWW©2020 IW 3C 2(国际万维网大会委员会),在知识共享CC-BY 4.0许可下发布。ACM ISBN 978-1-4503-7023-3/20/04。https://doi.org/10.1145/3366423.3380014回答[6]。 虽然KG的数据质量对于这种应用至关重要,但不幸的是,大规模KG通常不准确。实际上,它们是使用诸如信息提取(例如,Yago)、众包(例如,Wikidata)或使用基于嵌入的方法(参见[36]的概述)。这些方法不可避免地引入错误信息,例如,错误地消除了实体的歧义或错误的关系。在这种情况下,一个共同的任务是在幼儿园中发现不正确的事实 虽然关于这个主题的许多工作都集中在机器学习技术上(例如, [15,27]),依赖于符号推理的方法(例如,[25,32])由于其准确性和人类可解释性[26],已经显示出这项任务的好处用于检测KG中的不正确事实的一个突出的这样的方法是计算KG相对于手动制作的本体的不一致解释[14],本体是捕获相关感兴趣域和强制执行某些语句不能一起出现的约束的公理集。 在图1的底部呈现的示例本体指出,hasCustomer关系的范围是Company,isCityOf关系的域是City,并且类City、Company和Country是不相交的。这种本体通常是由领域专家精心创建的,并且KG中的错误通常以KG中是否存在与伴随的本体相矛盾的三元组为特征。很容易验证我们的样本KG与本体相矛盾,因为丰田和诺基亚属于不相交的类Company和City。导致这种情况的最小公理集是一种不一致的解释。检测和解释用本体增强的KG中的不一致性是基本的和充分研究的知识管理任务[13,26]。众所周知,找到所有甚至一些解释需要计算,因此无法扩展麦卡菲hasCustomerPopularName丰田hasCustomerisCityOfisCityOf日本国家IBMhasCustomer诺基亚芬兰国家联系我们WWWTran等人2614⊆∈∈∈∈⊆ ∈ ⊆×·∈我(·)I(G)G∈()()∈∈G[28]第二十八话 这甚至适用于允许可扩展处理的轻量级本体语言,因为解释的数量可能是巨大的:在DBpedia中至少有3,500,000个这样的解释[28]。总体思路。我们提出了一种新的方法来计算inconsis-表1:本文中考虑的本体语言的语义和语义,其中A,R分别是类名和属性名;C和D是类表达式,P,S是属性表达式,a,b是个体。句法语义对大型幼儿园的解释我们的方法的关键思想是识别本体语言并构建原始KG的压缩表示,称为抽象(抽象KG),使得对于以该语言编写的任何本体,满足以下要求:[R1]保持KGRRII×IObjectInverseOf(R){}|d,eAAII猫头鹰:东西英文名:NothingObjectComplementOf(C)I\CIObjectIntersectionOf(C)CIDIObjectUnionOf(C,D)CIDI如果本体论的抽象是这样的,[R2]保留KG[R3]小于KG:抽象的大小比原始KG的大小小得多。然后,代替检查一致性和直接在原始KG(w.r.t.本体),我们在其抽象上执行这样的操作R1-R2的要求捐款.我们展示了这种抽象的存在,一个相当有表现力的片段的Web本体语言(OWL 2)。更确切地说,我们的贡献如下:根据R1-R3的要求我们确定了一个片段的OWL 2的不一致的解释,可以通过划分成小的独立模块的输入KG计算。对于识别出的OWL 2片段,我们开发了一个有效的算法来计算基于数据抽象的不一致知识图我们在NPD[30], Yago[31]和DB- pedia [19] KG上评估了我们的方法,结果非常有希望:我们设法计算了数千个不一致的解释及其模式,直接在原始KG上计算是不可行的。2预赛知识图谱和本体论。我们假设可数对-ObjectSomeValuesFrom(P,owl:Thing){d|e∈SubClassOf(C,D)CIISubObjectProperty Of(P,S)PISITransitiveObjectProperty(P)PIPIPIClassAssertion(C,a)aI∈CIObjectProperty Assertion(R,a,b)aI,bI∈RI其中ANC,RNP,C1,C2是类,P是属性。类和属性可以用来定义形式化描述感兴趣领域的公理,这些公理的集合称为本体。表1描述了本文中考虑的公理 注意,这些公理可以表达其他常见 的 OWL 2 公 理 , 例 如 : InverseObjectProperties 、ObjectPropertyDomain、ObjectPropertyRange、EquivalentClasses和DisjointClasses。不一致和不一致。知识图和本体的语义通过解释使用OWL 2直接模型理论语义来定义[24]。一种解释=吉尔伊岛由一个非空集组成 ,定义域为和一个插值函数I,它分配给每个ANCasubsetAI每一个RNRabinaryrRII一个人,一个人,Ni元素aI我是 。 这个赋值扩展到(复杂的)类和属性,如表1所示。一个解释I满足一个公理α(记作I |= α),如果表1中的相应条件成立。给定KG G和本体O,I是G O的模型(写作I |= GO)如果I|对于所有的公理α ∈ G <$O,α = α。我们说G O包含一个公理α(记作G O |= α),如果G ∈ O的每个模型都满足α. 一个知识图G是不一致的w.r.t.本体O,如果不存在用于G本体O的模型在这种情况下,我们也说G O不一致。直觉上,当G的某些事实与O的某些公理相矛盾时,G <$O是不相容的。一个解释不一致的G O[13],表示为类名称的明智不相交集合N、N和N,例如,伙伴,道具-E=EGEOwith EG EO 是一个最小的子集-C P I姓名,例如,包含不相容子集例如,在一个示例中,图1中的KG部分hasCustomer和个人,例如, 丰田 知识图(KG)是一元和二元事实的有限集合,也称为断言,其形式为C a和Ra , b , 其 中 C NC , R NP 和 a , bNI , 例 如 , PopularName(Nokia)或hasCustomer(McAfee,Nokia)。我们用ind表示出现在中的个体集合。从类和属性名称可以(递归)定义复杂的类C和属性P以下的OWL 2规范。在这项工作中,我们关注以下类型的类和属性:P::=R|ObjectInverseOf(P)C::=owl:Thing|猫头鹰:没什么|一|ObjectComplementOf(C)|ObjectIntersectionOf(C1,C2)|ObjectUnionOf ( C1 , C2 ) |ObjectSomeValuesFrom(P,owl:Thing),陈述Mcaffee具有CustomerToyota和Toyota是City Of Japan连同三个示例本体公理是一种解释。一般来说,G O的不一致性可能有多种解释。同态。我们现在定义KG之间的同态,为我们的方法建立理论基础。定义2.1. 设G1和G2是知识图,h:ind(G1)→ind(G2)是从G1中出现的个体到G2中出现的个体的映射。 我们把h直接推广到公理:h(C(a))= C(h(a)),h(R(a,b))= R(h(a),h(b)). 对于每个本体O,我们定义h(O)= O,并且定义h(G1)={h(α)|α ∈ G1}。我们说h是一个同态(从G1到G2),如果h(G1)<$G2。····大规模知识图中不一致性解释的快速计算WWW2615知识图KG模块抽象步骤1模块建造步骤2模块抽象步骤4不一致解释计算步骤4本体抽象的不一致性解释知识图不一致性解释Ç•()下一页∈ÇG|O∈Ç ⟨⟩⟨ ⟩ ∈Ç()ÇGÇÇ我|G OÇG ∪ O(() )}∈ ⟨ ⟩ ∈ ⟨ ⟩ ∈我的歌∈()G OG O()}{|O|()()•()的方式⊆不一致解释重构步骤3引理3.2. 设G是一个KG,O是一个本体.则G <$O是相容的当且仅当M(a,G)<$O对每个a ∈ind(G)是相容的.在证明引理3.2之前,我们先证明以下命题。建议我在3.3。设G是一个知识图,使得{R(a,b ′),R(a′,b)}<$G,对于某些性质R和个体a,b,a′,b ′. 进一步,设G′=G <${R(a,b)}.然后,对于每个本体O,我们有GO是一致的,意味着G′O是一致的。图2:方法概述。下面的著名引理说明了蕴涵在同态下是保持的。引理2.2. 设h:ind(G1)→ind(G2)是知识图G1和G2之间的同态.然后,对于每个本体O和每个公理α,我们有G1O |= α隐含G2O |=h(α)。3解释KG不一致性在本节中,我们将介绍计算KG不一致性的所有假设的方法我们继续介绍该方法的概述,然后描述每个步骤的细节,然后证明正确性。最后,所有的步骤放在一起,并提出了一个完整的详细算法的方法。方法概述。在图2中,我们展示了我们的方法的高级在步骤1中,对于每个KG个体a,我们构建其模块(第二节)。3.1)。 在步骤2中,我们检测模块之间的共性并计算它们的紧凑表示,即, 抽象(Sec. 3.2)。所有模块抽象的联合给出了整个KG的抽象。如SEC所示4、这种KG抽象在实践中比原来的KG要小得多。 步骤3将本体和计算的抽象作为输入,并调用现成的推理器来计算抽象模块的不一致性解释,这些抽象模块是原始KG的不一致性解释的模式。最后,在步骤4(Sec.3.3),我们从步骤3中计算的结果重建原始KG的解释3.1 模与不一致局部性在KG中,实体是高度连接的,因此,本体论ax-PROOF Propos I t I on 3.3. 我们假设是相容的,并证明了′是相容的。我们的想法是建立一个模型,”基于一个模型。让成为...的模范我们构造一个解释如下:对于每个个体a和类名A,r是特定的;并且对于每个p对象名P,我们定义:P=PI{paI,bI|O|=SubObjectPropertyOfR,PbI,aI=SubObjectPropertyOfObjectInverseOfR,P.我们证明了除了属性传递性公理之外的所有公理的蕴含 由于=和类名和个体的解释在中保持相同,我们在'中包含每个类断言。此外,根据的定义,性质的解释被扩展,使得a,b <$R,因此, 包含每个性质断言R a,b in ′。这还有待证明。我们用归纳法证明了,对于每一类E-指数D,都有D_i=DI .案例D=owl:Thing,D=owl:Nothing,以及D=A,其中ANC直接从的定义得出。CaseD = ObjectSomeValuesFrom R,owl:Thing. 我们考虑的情况下,其中R是一个属性名称;逆属性的情况是类似的。 设d是D中的任意元素。 根据表1中表示的存在公理的语义,我们有d ObjectSomeValuesFromP,owl:Thing当且仅当re存在公司简介 d,eP. 如果d,ePI,然后是dDI. 另一种是,从,d,e从角色扩展中的一种情况得出结果。 我们考虑d=aI ,e=bI 的 情 况 ,其中e为O|=SubObjectPropertyOf(R,P)(其他情况类似)。 设R(a,b ′)∈ G,I是GI<$O的一个模型,我们得到了εaI ,b′I <$ ∈PI 。最后,IOM可以触发多跳推理步骤,例如,transitiv-d=aI ∈D. 既然d是任意的,我们就有D 坎迪岛传递对象属性(transitiveObjectProperty,foaf)公理,其中foaf代表朋友的朋友,结合KG中的两个事实foaf(John,Mary)和foaf(Mary,Tom)推断新的事实foaf(John,Tom)。然而,在所考虑的本体语言下,我们发现KG不一致性具有局部属性,即,检查KG的不一致性的问题(w.r.t. 本体O)可以被简化为此外,由于性质的解释被扩展,我们得到了D ID。因此,D I = D。案例D=ObjectComplementOfD′,D=ObjectIntersectionOfD1,D2和D = ObjectunionOf D1,D2从它们的语义和归纳假设中得出.对于每个子类公理SubClassOf(C1,C2)∈ O,我们有检查分离KG模块的不一致性(w.r.t.O)。C1=C1IC2I=C2,i. e. Ç|=SubClassOf(C1,C2)。以来定义3.1(模块)。 给定一个KG G和一个个体a ∈ind(G),w.r.t. G定义为M(a,G)={α|α ∈ G,a在α中。 我们将G中出现的个体的所有模的集合记为MG={M(a,G)|a∈ind(G)}.直观地说,知识图中个体a的模块是包含a的所有事实的集合。在图1的示例中,Nokia的模块定义为M(Nokia,G)={PopularName(Nokia),hasCustomer(Mcaffee,Nokia),isCityOf(Nokia,Japan)}。性质的解释是根据子性质公理展开的,因此,它包含O中的每个子性质公理。在最后一步中,通过扩展性质的解释,使得<$’包含O中的每个传递性公理,从而得到<$’。我们可以重复前面的步骤来证明,O′仍然包含O中的其他公理。因此,|=G ′<$O,这意味着G ′<$O是相容的。□现在我们准备证明引理3.2。·WWWTran等人2616G G GM( G)GG OM(G)<$O ∈(G)G GGE()∈()下一页(){()()}这意味着G1= O,其中G1=联系我们a∈ind(G)M′(a,G)是相容的.G′不一致性解释E′使得E′可以是齐次的,引理的证明3.2. “仅当方向”是平凡的,因为的每个模块是的子集,因此,是一致的,意味着所有模块都是一致的。 我们通过假设以下条件来证明剩余的方向:对所有的ind都是一致的;我们证明了它也是一致的。这是通过以下步骤完成的首先,对于每个模块,例如,a,of,我们重命名其中的所有个体,除了a. t。 每个模块中出现的个体是成对不相交的。 它允许我们使用模型的不相交的联合来构造一个接近于G. O的模型的解释。对于每一个模M(a,G),我们将得到的重命名的模记为M ′(a,G),由于M(a,G)<$0是相容的,我们有M ′(a,G)<$0是相容的(根据引理2.2)。 设a为M ′的模型(图1所有最大类型的抽象抽象的解释原始KG的不一致解释a,G)≠ 0,对于每个a∈ind(G).我们定义把I解释为所有个体的所有Ia的不相交的联合图3:KG抽象和解释(没有EO)。ao发生在G. 那我|={M?′(a,G)|a∈ind(G)}<$O,其中G)如果对于G的每个不一致解释E,存在一个其次,我们通过增加G中所有的属性断言来扩展G1,得到G2,定义 为 G2 = G1 <${ObjectPropertyAssertion ( R , a , b )|ObjectPropertyAssertion(R,a,b)∈ G1}.根据命题3.3,我们得到G2-O是一致的.最后,利用单调性,得到了G <$O是相容的,因为G <$G2和G2<$O是相容的.□使用引理3.2,我们可以证明,KG的不一致性的所有解释都可以通过计算其模的解释来获得,因此在我们的方法的步骤1中,我们构造模。定理3.4. 设G是KG,O是本体S. G是不一致的。 则E是G∈O的不一致性的一个解释当且仅当存在a∈ind(G)s. t. M(a,G)<$O是不一致的,E是M(a,G)<$O不一致的一个解释.定理3.4的证明定理3.4的“如果”方向成立,因为通过单调性,对G的模的不一致性的所有解释都是对G的不一致性的解释。我们现在展示的是“只有如果”的方向。设E=EG <$EO,其中EG <$G和EO <$O是G <$O的不一致解释。由于E是不相容的,根据引理3.2,存在一个出现在GE中的个体a,使得M(a,EG)<$OE是不相容的。设E′是M(a,EG)<$EO不一致性的一个解释,也是G <$O不一致性的一个解释.由于E ′ <$M(a,E G)<$E O <$E和E是最小的,我们有E = E ′,这是需要证明的。 □使用定理3.4,人们已经可以基于KG的模计算KG的不一致性解释,即使没有进一步的步骤。我们在第4节中表明,这在基线上提供了显着的加速。 更重要的是,我们观察到,许多模块具有相似的结构和计算不一致的解释,多个模块可以只执行一个代表性的模块。这激发了KG抽象的进一步步骤phically映射to.保持抽象图的不一致性和解释性的抽象称为的抽象。显然,任何KG的抽象都满足R1-R2的要求在下文中,我们提出了一种用于构造显著小于原始真实世界KG的KG抽象的方法,即, R3在实践中适用于它们(见第4节)。KG的抽象是通过识别具有相似结构的模块来计算的,然后仅用单个代表模块来表示每组相似模块为了刻画模块的结构,我们依赖于个体的局部类型[9,11]。直觉上,个体的局部类型表示一组类以及该个体的相应模块中出现的传入和传出属性。定义3.5(局部类型)。 设G是KG,a ∈ ind(G),则w.r.t.G,当G从上下文清楚时写作τ(a,G)或τ(a),被定义为元组τ(a)= τi(a),τc(a),τo(a),其中τi(a)={R|R(c,a)∈ G},τc(a)={A|A(a)∈ G},τo(a)={S |S(a ,b)∈ G}.局部型t = tti, tc, tot 小于或等于 局 部 型pet′=ti′,tc′,to′t,记作t t t ′,当且仅当titi′,tctc′,toto′。我们写tt′ifftt′和tt′。给定一个局部类型集合S,局部类型t称为极大(在S中),如果t∈S且不存在t′∈Stt′。每个局部类型都由一组类和属性组成我们现在通过用NV中的抽象个体实例化这些类和属性来为每个局部类型定义一个(星形)抽象。定义3.6(星形抽象)。 设t = ti,tc,to i是局部类型,t的星形抽象定义为abs(t)={A(vt)|A ∈ tc}<${R(uR,vt)|R∈ ti}<${S(vt,wS)|S ∈ to},其中3.2图形抽象v,uR,wS是唯一的不 t、R、S和v。不tt每个测试的抽象个体设NV是与NC、NP和NI不相交的抽象个体的可数集。抽象KG是由抽象个体上的事实组成的KG,即,形式为C u,R u,v的事实的有限集合,其中u,vNV,CNC,RNP。直觉上,每个抽象的个体都是原始KG中几个个体的代表。给定一个本体O和一个KGG,一个抽象图G′是不一致保持的(对于G),当G′是一致的(w.r.t.O)当且仅当G是相容的。抽象图G′是解释保持的(对于为了简单起见,我们将省略星形抽象中个体这些只是在形式上使这些个体可区分的需要实施例3.7.图1中的Toyota和Nokia具有相同的本地类型,定义为t =PopularName,hasCustomer,isCityOf。对于t,abs t = PopularName v,hasCustomer u,v,isCityOf(v,w)是星形抽象。u1有客户是CityOf联系我们v1w1国家v2hasCustomerw2u3isCityOfv3步骤1和2u1有客户步骤3v1isCityOfw1步骤4麦卡菲有客户丰田isCityOf日本麦卡菲有客户诺基亚isCityOf芬兰IBM有客户诺基亚isCityOf芬兰大规模知识图中不一致性解释的快速计算WWW2617∈G联系我们 ( ( G)|∈(G)}←∅GO(小时)′′GEGGO()()下一页( )(英、加)|(G)|GO()NH2 O( )OOOE EG EO EGEOGG O(())OG OG OG O算法1:计算知识图Gw.r.t.本体论O输入:知识图和本体输出:设置所有解释的不一致性,1所有解释/* 步骤12:计算*/中所有个体2种类型τ a,aind3 对于每个最大τ类型做/* 步骤3:计算星形的解释表2:数据集的统计KG公理断言实体类关系NPD 678 929,710 264,081 343 142Yago1,0457,321,308 3,275,59396038DBpedia4,28722,955,1735,867,913685663表3:不一致解释计算结果τ的提取 使用推理机 */4X←abs(τ)≠ 0不一致的所有解释模块总数已处理模块模式解释时间/* 步骤4:获取G的解释*/5foreachE=EGEO ∈Xdo/*在EG中计算vτ的局部类型*/6τ′=τ(vτ,EG)7newExpls←τ′在G中的所有实现8allExpls←allExpls新的Expls颗粒10 - 72模块化264,081 243,467 - 41,128 72抽象11,97011,86620,25160,5544.5颗粒10 - 72模块化3,275,593 1,624,196 - 1,547 72抽象2,8212,821693,5650.1颗粒10 - 729 返回所有解释对于每一种解释 =,并且是最小的。因此,我们只需要考虑最大局部类型。 可以证明,对于τ和τ′,使得ττ′,对于每个本体,如果absτ不一致,则absτ也不一致,并且abs τ ′的不一致解释可以用来获得absτ的所有不一致解释。因此,较小的类型与计算解释无关3.3不一致性解释重构我们现在定义一个局部类型的实现,它允许我们从抽象的解释中重构原始KG的解释。定义3.8(局部类型的 设G是KG,τ ′是局部类型. 对于a ∈ind(G),τ′的一个实现是Gs.t的包含最小子集实a,τ ′. τ(a,reala,τ ′)= τ. τ′在G中的实现是τ ′对于G中出现的每个个体的所有实现的集合。在图3中,我们给出了抽象的不一致解释的KG部分和三个相应的解释(即,对于图1中的原始KG,τ v 1的实现。前者被认为是后者的解释模式3.4将所有人聚集在一起最后,我们继续使用算法1,该算法计算KGw.r.t.的所有解释。使用抽象的本体论 由于它迭代局部类型,其数量由ind限 制 ,并且抽象的解释数量以及类型的实现数量由和的签名限制,算法1终止。 图3示出了图1中的示例的算法的所有步骤。下面的定理证明了它的正确性。定理3.9. 给定KG G和本体O作为Alg的输入。1,α ∈ind(G)abs(τ(a))是G的一个抽象,集合allExpls由G关于r.t. O.定理3.9的证明每个类型τ的抽象abs τ可以同态映射到τ的任何实现。因此,根据引理2.2,如果τ′是某个个体的局部类型模块化5,867,913 647,443 - 73,152 72抽象91,084904461,79720,093,61721的解释。 这表明allExpls(在算法1中)的每个元素都是对的不一致解释。为了证明allExpls包含的所有解释,我们依赖于一致性的断言当且仅当absτ a对于中的每个个体a都是一致的,这可以基于命题3.3来证明,就像引理3.2的证明一样。然后,类似于定理3.4的证明,我们证明了G <$O的不一致性的每一个解释都可以通过对某个极大局部型τ的abs(τ)<$O的某种不一致性解释得到。□4实验我们已经在系统原型中实现了计算不一致解释的方法,并在三个配 备 了 本 体 的 真 实 世 界 KG 上 对 其 进 行 了 评 估 : 挪 威 石 油 局(NPD)[30],Yago [31]和DBpedia [19]。由于NPD数据集的原始版本是一致的,因此为了我们的实验目的,我们通过添加2%的随机属性和类断言来引入不一致性。我们使用NPD和DBpedia KG提供的本体 对于Yago,我们将可用的简单分类法及其关系模式的联合作为本体。我们实验的更多细节是公开的。1实验设置。为了证明我们的方法的好处(抽象)在Alg。1,我们将其与检测到的不一致解释的数量进行比较,并与以下基线进行比较:第3.1节(模块化)中描述的基于模块的实现和现成的推理器[29](Pellet),其中KG被作为一个整体处理请注意,对于计算解释,Pellet与其他最先进的推理机一样有效,例如,HermiT [8].表2给出了测试本体和KG的大小,以及实体、类和属性的数量。所有实验都在具有500GB内存的48核机器上进行。调用Pellet reasoner计算所有设置中的不一致解释。在抽象设置中,我们将为最大局部类型(在算法1中描述)生成的每个抽象视为一个模块。我们为整个计算设置了72小时的超时,为处理设置了2分钟的超时抽象和模块设置中的每个模块vτ在abs(τ)<$O的不一致解释中,则实现-G中的τ ′(连同本体公理)的结果是不一致的1 https://github.com/boschresearch/kg_inconsistency_explanationDBpedia YagoNPDG O方法WWWTran等人2618NPD Yago DBpedia表4:最常见的不一致解释模式。抽象KG断言 本体公理wn:building(v)isLocatedIn(u,v)bandMember(u1,v)DisjointClasses(wn:building,GeoEntity)ObjectPropertyRange(isLocatedIn,GeoEntity)SubClassOf(Ship,MeanOf Transportation)SubClassOf(Instrument,Product),SubClassOf(Product,Ship)wn:建筑物(J._ Forrestal_Building>)isLocatedIn(,)乐器(, )的方式1,7680.60.50.40.30.20.10仪器(u2,v)DisjointClasses(MeanOf Transportation,Person)ObjectPropertyRange(bandMember,Person)ObjectPropertyRange(instrument,Instrument)乐队成员(Baka_Beyond>,Djembe>)11,357,4305相关工作在幼儿园中检测错误信息的问题最近得到了很多关注。提出的方法可以大致分为基于几何学的[12,20-18,37],以及前两组的组合[21,32],其中学习约束(例如,从编辑历史[32]),并利用不一致检测。在基于神经网络的方法中,P2 P3 P4 P5 P6 P7 P8 P9 P10图4:前10个常见解释的分布结果在表3中,我们比较了这三种方法计算的模块总数超时内处理的模块数和找到的解释模式数以及它们产生的实际解释颗粒推理器未能在给定超时内处理所有测试KG,即, 通过这种基线方法没有计算出不一致的解释。简单地将KG分割成更小的模块已经是有益的,可以给出一些解释。然而,由于要考虑的模块的数量仍然非常大,它们中的许多不能在时间限制内处理,因此,仍然仅检测到很少的不一致解释。抽象方法将需要考虑的模块数量显著减少到原始模块的0.1%、1.55%和4.5%(即, 通过模块化方法计算)分别用于Yago、DBpedia和NPD。 虽然不是所有的模块都可以被调用的推理器处理,但与基线相比,我们设法处理了更大比例的KG。我们的方法在6分钟、4.5小时和21小时内计算了Yago、NPD和DBpedia的不一致性解释,这自然与所考虑的KG及其本体的大小和复杂性相关。 结果表明,我们的方法可以在合理的时间内处理大型KG,这是超出了早期提出的方法可以处理。图4描述了前10个最常见的解释模式(X轴),以及它们所代表的具体不一致解释的百分比(Y轴)。大多数解释都遵循五种主要模式之一重要的是,对这些模式的分析可能会揭示信息提取过程中的系统性问题,这使得模式本身具有价值。 如表4所示,大约50%的解释是由于本体指定isLocatedIn的范围是GeoEntity,这与 建 筑 物 不 相 交 。 然而, 在 KG 中 , 有 1.7K 个三 元 组 通 过isLocatedIn关系将某个实体连接到属于建筑类的实体。类似地,在DBpedia 中 , 大 约 57% 的 解 释 是 由 一 个 实 体 是 具 有 关 系bandMember和playInstrument的三元组的对象引起的,它们的域分别是Person和Instrument,已知它们是不相交的。与我们最接近的是[22,27],其中通过利用KG关系和类型的统计分布来识别故障三元组这一类别的另一项相关工作[15]引入了一个机器学习模型来衡量三元组的可信度我们的方法属于基于逻辑的组,其中约束[25]或本体论[2,16]用于识别和修复KG中的错误特别是,工作[1,13,33]是最相关的;然而,与我们的方法相比,他们没有利用KG的基于模块的分裂和不一致解释计算的抽象,并且没有我们的方法那么大。使用压缩/汇总数据和模块来解决大型KG中的可扩展性问题的想法已经在几个作品中进行了探索[4,35]。 我们的方法在精神上类似于为KG扩展而开发的抽象细化方法[9- 11 ],这与我们计算不一致解释的目标不同。重要的是,我们已经确定了一个新的片段的OWL中的细化阶段是没有必要的,并已表明,只有最大的本地类型需要考虑计算的解释。 计算不一致性解释也是通过缓存来完成的[28],但只能发现有限类型的解释,例如,第4节中报告的最常见的解释尚未被[28]中的方法检测到。6结论提出了一种基于KG抽象的KG不一致解释计算方法我们的解释的适用性是多方面的。例如,它们可以用于促进幼儿园中的错误解决, 遵循Bi-envenu等人的自动方法。 [1]或Tanon et al. [32],其中一个人决定哪些公理被删除。我们的方法的另一个优点是,它提供了错误模式,可以揭示在KG建设过程中的系统性问题。我们计划在未来开拓这一方向,例如, 通过利用不一致的解释来指导信息提取过程。另一个未来的方向是扩展我们的方法来处理更多的表达本体。目前,它仅限于所呈现的OWL 2片段。 添加其他标准的OWL 2公理,如sameAs或someValuesFrom/allValuesFrom ax-ioms的无限制形式,将使方法不完整。 我们的算法扩展到更大的片段OWL 2的可能性是通过调整它DBpediaYago大规模知识图中不一致性解释的快速计算WWW2619以“即用即付”的方式,例如,通过执行额外的推理步骤来处理新的公理,并采用[11]中所做的精化阶段。引用[1] Meghyn Bienvenu,Camille Bourgaux,and François Goasdoué. 2016.不一致DL-Lite知识库的查询驱动修复 在第二十五届国际人工智能联合会议的会议记录中,IJCAI 2016,纽约,美国,2016年7月9日至15日。957-964.[2] Stefan Bischof , Markus Krötzsch , AxelPolleres , andSebastianRudolph.2014年。SPARQL 1.1中的模式无关查询重写 在语义网-ISWC2014-第13届国际语义网会议,Riva del Garda,意大利,2014年10月19日至23日。会议记录,第一部分584-600[3] 库 尔 特 ·DBollacker , Colin Evans , Praveen Paritosh , Tim Sturge , andJamie Tay-lor. 2008年Freebase:一个协作创建的图形数据库,用于构建人类 知 识 。 ACM SIGMOD International Conference on Management of Data ,SIGMOD 2008,温哥华,加拿大,2008年6月10日至12日。1247-1250.[4] Julian Dolby,Edith Schonberg,and KavithaSrinivas. 2009年可扩展的高表达推理机(Scalable Highly Expressive Reasoner,SHER) J. 网络语义学(2009)。[5] XinDong ,Evgeniy Gabrilovich,Geremy Heitz ,Wilko Horn,Ni Lao,Kevin Murphy,Thomas Strohmann,Shaohua Sun,and Wei Zhang. 2014年。知识库:一种网络规模的概率知识融合方法。在第20届ACM SIGKDD知识发现和数据挖掘国际会议,KDD '14,纽约,纽约,美国-2014年8月24日至27日。601-610[6] David A.作者:Eric W.放大图片作者:David Gondek,J.放大图片创作者:JohnM.Prager , Nico Schlaefer , and Christopher A. 韦 尔 蒂 2010 年 。 构 建Watson:DeepQA项目概述。AI Magazine31,3(2010),59[7] 穆 罕 默 德 ·H. Gad-Elrab , Dar
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- BottleJS快速入门:演示JavaScript依赖注入优势
- vConsole插件使用教程:输出与复制日志文件
- Node.js v12.7.0版本发布 - 适合高性能Web服务器与网络应用
- Android中实现图片的双指和双击缩放功能
- Anum Pinki英语至乌尔都语开源词典:23000词汇会话
- 三菱电机SLIMDIP智能功率模块在变频洗衣机的应用分析
- 用JavaScript实现的剪刀石头布游戏指南
- Node.js v12.22.1版发布 - 跨平台JavaScript环境新选择
- Infix修复发布:探索新的中缀处理方式
- 罕见疾病酶替代疗法药物非临床研究指导原则报告
- Node.js v10.20.0 版本发布,性能卓越的服务器端JavaScript
- hap-java-client:Java实现的HAP客户端库解析
- Shreyas Satish的GitHub博客自动化静态站点技术解析
- vtomole个人博客网站建设与维护经验分享
- MEAN.JS全栈解决方案:打造MongoDB、Express、AngularJS和Node.js应用
- 东南大学网络空间安全学院复试代码解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功