没有合适的资源?快使用搜索试试~ 我知道了~
open information extraction systems such NELL, Google’s Knowl-edge Vault [9], Microsoft’s Satori continuously learn new factsfrom the Web and it is important to record the date on which afact is learned. This is evident from the NELL knowledge graphas they keep track of learned dates in terms of iterations. Hence,transaction times represent the date on which a fact is extractedor recorded. The valid time indicates the time period on which afact is considered valid or true. Furthermore, when such facts arelearned/extracted from open text, they are associated with someconfidence score. We need a model that supports these three desir-able aspects (transaction time, validity time, and confidence scores).Thus, in this work, we propose a framework for representing andquerying probabilistic bitemporal knowledge graphs.Probabilistic graphical models have been widely used to reasonabout facts extracted at Web scale using a combination of hand-crafted and extracted inference rules [21]. In particular, Markovlogic networks (MLNs) can be used to deal with temporal relationsin open information extraction [17] or check the consistency ofknowledge bases [5, 6]. MLNs extend first order logic with un-certainty and are considered as templates for defining Markovnetworks. Another important probabilistic programming languageis ProbLog [15] which is a probabilistic extension of Prolog. LikeMLNs, it has been used for reasoning in probabilistic knowledgebases. In both MLNs and ProbLog, there are two important reason-ing tasks marginal and most probable explanation (MPE) inference.The former computes the probability of a set of random variables(temporal facts in our setting) whereas the later computes the mostprobable, consistent and conflict-free world (temporal knowledgegraph). In this work, we propose a probabilistic database model forbitemporal knowledge graphs.A relevant problem in probabilistic temporal KGs is temporalcoalescing. Temporal coalescing is the process of merging factswith identical non-temporal arguments and adjacent or overlap-ping time-intervals. This problem has been throughly studied inthe database community in a non-probabilistic setting (look forinstance [2]). In this paper we investigate two approaches for coa-lescing probabilistic temporal facts. Overall, the contributions ofthis paper are: (i) we propose a probabilistic bitemporal model forWeb knowledge graphs, (ii) we study temporal coalescing in a prob-abilistic setting, (iii) we provide query rewriting for marginal andMPE inference tasks, and (iv) we provide experimental results ofthe proposed approach over the Wikidata KG.Outline. The outline of this paper is as follows: next we providea motivating example. In Section 2 we discuss the state of the art,followed by the introduction of bitemporal knowledge graphs inSection 3. We present our main contribution in Section 4. Prelim-inary experimental results are presented in Section 5; and finallywe present the discussion of related work (Section 6) along withconcluding remarks and outlook (Section 7).Track: 8th Temporal Web Analytics Workshop WWW 2018, April 23-27, 2018, Lyon, France17570面向概率双时间知识图谱0Melisachew Wudage Chekol数据与Web科学小组 曼海姆大学mel@informatik.uni-mannheim.de0Heiner Stuckenschmidt数据与Web科学小组 曼海姆大学heiner@informatik.uni-mannheim.de0摘要0开放信息提取作为构建和扩展知识图谱的工具的出现,促进了时间数据的增长,例如YAGO,NELL和Wikidata。虽然YAGO和Wikidata保留事实的有效时间,NELL记录了从某些Web语料库中检索到事实的时间点。这些知识图谱(KGs)共同存储从维基百科和其他来源提取的事实。由于用于构建和扩展KGs的提取工具(如NELL)的不精确性质,KGs中的事实被加权(表示事实正确性的置信度值)。此外,NELL可以被视为事务时间KG,因为每个事实都与提取日期相关联。另一方面,YAGO和Wikidata使用有效时间模型,因为它们仅保留与其有效时间(时间范围)一起的事实。在本文中,我们提出了一种用于维护和查询概率时间知识图谱的双时间模型(结合了事务和有效时间模型)。我们报告了所提方法的评估结果。0ACM参考格式:Melisachew Wudage Chekol和HeinerStuckenschmidt。2018年。面向概率双时间知识图谱。在WWW '18Companion:2018年Web会议伴侣,2018年4月23日至27日,法国里昂。ACM,纽约,美国,6页。https://doi.org/10.1145/3184558.319163701 引言0时间数据库已经得到广泛研究(参见调查[22])。最近,数据库供应商(如Teradata,Oracle DB,IBMDB2,PostgreSQL等)对于时间数据的支持越来越多。另一方面,对于概率时间数据库的关注很少[7,10,18],对于概率时间知识图谱更少[5,11]。几个Web知识图谱,如YAGO [14],Wikidata [24],NELL[3]和DBpe- dia[1],已经包含时间数据。特别是,NELL包含概率时间数据,其中知识库中的每个事实都与事务时间(提取和存储事实的时间)相关联。此外,开放信息提取作为构建和扩展知识图谱(KGs)的工具的出现,促进了时间数据的增长[20,23]。关于知识图谱,尽管维护事实的有效时间显然是相关的,但事务时间的存在有些可争议。除了有效时间支持外,维护事实的事务时间很重要,因为永不停止的开放信息提取系统(如NELL,Google的Knowledge Vault[9],Microsoft的Satori)不断从Web中学习新的事实,并且记录学习到事实的日期非常重要。这从NELL知识图谱中可以看出,因为他们记录了迭代的学习日期。因此,事务时间表示提取或记录事实的日期。有效时间表示事实被认为有效或真实的时间段。此外,当从开放文本中学习/提取此类事实时,它们与某些置信度分数相关联。我们需要一个支持这三个可取的方面(事务时间,有效时间和置信度分数)的模型。因此,在这项工作中,我们提出了一种表示和查询概率双时间知识图谱的框架。概率图模型已被广泛用于使用手工制作和提取的推理规则组合推理Web规模的事实[21]。特别是,马尔可夫逻辑网络(MLNs)可用于处理开放信息提取中的时间关系[17]或检查知识库的一致性[5,6]。MLNs扩展了一阶逻辑与不确定性,并被认为是定义马尔可夫网络的模板。另一个重要的概率编程语言是ProbLog[15],它是Prolog的概率扩展。像MLNs一样,它已被用于推理概率知识库。在MLNs和ProbLog中,有两个重要的推理任务:边际推理和最可能解释(MPE)推理。前者计算一组随机变量(在我们的设置中为时间事实)的概率,而后者计算最可能的、一致的和无冲突的世界(时间知识图谱)。在这项工作中,我们提出了一个用于双时间知识图谱的概率数据库模型。概率时间KG中的一个相关问题是时间合并。时间合并是合并具有相同非时间参数和相邻或重叠时间间隔的事实的过程。这个问题在数据库社区中已经得到了深入研究(例如,请查看[2])。在本文中,我们研究了两种合并概率时间事实的方法。总的来说,本文的贡献包括:(i)我们提出了一个用于Web知识图谱的概率双时间模型,(ii)我们在概率设置中研究了时间合并,(iii)我们提供了边际和MPE推理任务的查询重写,以及(iv)我们提供了所提方法在WikidataKG上的实验结果。大纲。本文的大纲如下:接下来我们提供一个引人注目的例子。在第2节中,我们讨论现有技术,然后在第3节中介绍双时间知识图谱。我们在第4节中提出了我们的主要贡献。初步实验结果在第5节0本论文发表在知识共享署名4.0国际许可证(CC BY4.0)下。作者保留在个人和公司网站上传播作品的权利,并附有适当的归属。WWW '18Companion,2018年4月23日至27日,法国里昂,© 2018IW3C2(国际万维网会议委员会),根据知识共享CC BY 4.0许可证发布。ACM ISBN978-1-4503-5640-4/18/04。https://doi.org/10.1145/3184558.3191637fernando-torres type athlete(fernando-torres, home-stadium, anfield)10/11/20151.0(fernando-torres, playsfor, chelsea)09/02/20170.969(fernando-torres, playsfor, spain)08/08/20110.875fernando-torres playsfor atleticoMadrid(fernando-torres, playsfor, liverpool)[2007,2011)1.0(fernando-torres, playsfor, chelsea)[2011,2015)1.0(fernando-torres, playsfor, atleticoMadrid)[2016,now)1.0(i) 0.9375 :: playsfor(a, b, tb, te ) :−athleteledsportsteam(a, b, tb, te ).(ii) 0.9675 :: playsfor(a, b, t, t′) :−athleteledsportsteam(a, v, tb, te ),teamplaysagainstteam(b, v, t′b, t′e ),overlaps(tb, te, t′b, t′e ).(iii) 0.9375 :: playsfor(a, b, t, t′) :−athleteplayssport(a, v, tb, te ),teamplayssport(b, v, t′b, t′e ),overlaps(tb, te, t′b, t′e ).(iv) 0.5109 :: playsfor(a, b, t, t′) :−athleteplaysinleague(a, v, tb, te ),teamplaysinleague(b, v, t′b, t′e ),overlaps(tb, te, t′b, t′e ).17580NELL: 学习到的事实 学习日期 置信度0Wikidata: 提取的事实 有效时间 置信度0Table 1: NELL和Wikidata对Fernando Torres职业生涯的表示。01.1 动机0为了激发本研究的目的,我们依赖于两个知识库:NELL和Wikidata。NELL记录了事实的提取日期,如表1所示。例如,根据2017年9月2日的记录,FernandoTorres以96.9%的置信度为切尔西足球俱乐部效力。这表明NELL的表示模型类似于关系数据库中的事务时间。另一方面,Wikidata在某些事实上具有时间范围,例如,FernandoTorres在2001年至2007年期间为马德里竞技队效力,然后在2016年重新加入并继续效力。这表明Wikidata使用有效时间模型来建模时间信息。然而,Wikidata不记录事实的提取日期,相反,NELL不维护事实的有效时间。因此,缺少的是将事务时间和有效时间(即双时间)结合的模型。例如,以0.969的概率,FernandoTorres在2011年至2015年期间为切尔西足球俱乐部效力。该事实在2017年9月2日提取(或记录),如下所示:( fernando-torres ,playsfor , chelsea , [2011,2015), [09/02/2017,UC), 0.969)UC是untilchanged的缩写。当事务或记录日期的结束日期未知时,用UC表示。除了概率性的时间事实,知识库(KB)还可以包含(时间)推理规则,例如,从NELLKB中使用Prob2FOIL学习到的一些推理规则如下所示:(i)如果一个运动员领导一个运动队,那么她很可能为该队效力;(ii)在同一时间段,如果一个运动员领导一个运动队,并且她的队伍与另一个队伍对抗,那么她很可能为该队效力;(iii)如果一个运动员参加某项运动,并且一个队伍在重叠的时间段内进行该项运动,那么该运动员很可能为该队效力;(iv)在某个时间段内,如果一个运动员参加某个联赛,并且一个队伍在同一时间段内参加该联赛,那么她很可能为该队效力。0为了对概率性时间事实和推理规则进行推理任务,本研究提出了一种用于概率性知识图谱的双时间模型。02 知识图谱0知识图谱是一组三元组,可以在W3C标准RDF数据模型中进行编码。设I和L为两个不相交的集合,分别表示IRI(标识资源)和字面量(字符字符串或其他类型的数据)的集合。我们将这些集合的并集(I∪L)简写为IL。形如(s,r,o)∈I×I×IL的三元组称为RDF三元组;s是主语,r是谓词或关系,o是三元组的对象。每个三元组可以被视为主语和对象之间由谓词标记的边;因此,一组RDF三元组被称为RDF图。可以通过为图中的每个三元组标记一个时间元素来扩展RDF图的时间信息。例如,时间元素可以表示三元组有效的时间段,即三元组的有效时间[12,13]。在下一节中,我们将使用双时态模型扩展知识图谱。模式和推理规则。知识图谱通常包含用于控制和管理数据质量和查询答案的背景知识。这些背景知识可以通过一阶逻辑来捕捉。Web规模的知识图谱通常包含使用轻量级语言(如RDFS(RDF模式)和OWL2(Web本体语言)配置文件)构建的本体。OWL2配置文件和RDFS是用于表示关系的域和范围、类和关系层次结构等构造的本体语言。其中一些语言可以用Horn逻辑表示。此外,本体学习(也称为模式归纳)是一种从Web语料库中自动提取推理/演绎规则的新范例。大多数规则提取系统生成Horn规则(我们称之为推理规则)。例如,Prob2FOIL[19]、SHERLOCK系统[21]和本体路径查找(OP)[6]可以高效地学习数千个一阶Horn规则。这些规则足够表达知识图谱中的复杂关系。我们使用Datalog语法表示推理规则。03 双时态知识图谱0双时态数据库是通过为数据库中的每个元组添加时间元素来扩展传统数据库的一种扩展[16]。双时态数据库中的元组被时间间隔时间戳化,表示元组的有效时间和事务时间。因此,双时态数据库需要两个时间宇宙的域,即有效时间宇宙和事务时间宇宙,并且将它们限制在T的某个子集上可能是有益的或方便的。因此,让Tv�T表示双时态知识图谱的有效时间宇宙,Tt�T表示其事务时间宇宙。我们将离散时间域T视为一个线性有序的有限时间点序列;例如,天、分钟或毫秒。有限域假设确保在概率扩展中存在有限多个可能的世界。时间间隔是一个有序对[tb,te)的时间点,其中tb≤te且tb,te∈T,表示从tb到te1的闭开时间点区间。我们将使用基于区间的时间域来定义我们的数据模型。通过将双时态数据库与知识图谱相结合,我们在第3节中提出了双时态知识图谱。01 可以扩展到其他基于区间的表示,例如[tb, te],左闭右闭区间。0Track: 2018年第8届时间Web分析研讨会,2018年4月23日至27日,法国里昂r3(x,z) :− r1(x,y) ∧ r2(y,z)becomesr3(x,z,v,v′,t,t ′) :− r1(x,y,vb,ve,tb,te ),r2(y,z,v′b,v′e,t ′b,t ′e ),v = min(vb,v′b ),v′ = max(ve,v′e ),vb ≤ v′e, v′b ≤ ve,t = min(t ,t ′ ),t ′ = max(te,t ′),tt ′, t ′te,17590多时态RDF数据库模型首先由Grandi[12]引入。这些模型允许捕捉数据中的多个时间方面,例如有效性、功效、事务等。在这项工作中,我们考虑有效时间和事务时间。双时态知识图谱具有两个时间域,即有效时间域和事务时间域。我们将它们限制在T的某个子集上,即让Tv�T表示知识图谱的有效时间宇宙,Tt�T表示其事务时间宇宙。有效时间是RDF三元组被认为是真实或有效的时间段。事务时间是将三元组添加到知识图谱中的时间。此外,双时态知识图谱支持事务和有效时间模型。0定义3.1(双时间知识图)。双时间知识图是一个知识图,其中图中的每个事实(s,r,o)与有效时间[v b,v e)∈Tv和事务时间[t b,te)∈Tt相关联,即д=(s,r,o,[v b,v e),[t b,te))。我们将д称为时间事实,并将其写为一阶谓词r(s,o,v b,ve,t b,t e)。事务时间的右无限时间间隔表示为[tb,UC),有效时间的表示为[vb,now),其中UC表示直到更改,now表示当前时间实例。0此外,我们从时间数据库[8]中借用了两个重要概念,即无重复和合并。如果对于图中的所有事实对r(s,o,v b,v e,t b,te),r(s,o,v ′ b,v ′ e,t ′ b,t ′ e)∈G,满足以下条件:[vb,v e)∩[v ′ b,v ′ e)=�和[t b,t e)∩[t ′ b,t ′e)=�。换句话说,如果两个时间事实的非时间项相同,则它们的时间项必须是不相交的(不重叠的)。时间合并是将具有相同非时间参数和相邻或重叠时间间隔的事实合并的过程。在概率设置中,这个问题尤其具有挑战性。进行合并并不直接,因为不清楚新的(合并的)事实的概率应该是多少,并且可能依赖于应用程序。我们将在下一节中研究这个问题。0示例1.我们将表1中的一些知识图的事实转换为双时间事实,如下所示。这与将NELL和WikidataKG对齐(或松散合并)以进行知识库完成或双时间知识图构建的任务相同。0playsfor(fernando-torres,chelsea,2011,2015,2017,UC)home-stadium(fernando-torres,anfield-stadium,2007,2011,2015,UC)playsfor(fernando-torres,atleticoMadrid,2001,2007,2016,now)0为了演示的目的,我们删除了年份和月份,只写了有效时间和事务时间的年份。给定一个双时间知识图G,其在时间t的快照是图G(t)(非时间知识图):G(t) ={(s,p,o)|(s,p,o,[t,t),[t,t))∈G}。与双时间知识图相关联的非时间知识图是u(G)=∪tG(t),图G(t)的并集。依靠这个特征,我们定义时间蕴涵。0定义3.2(时间蕴涵)。我们如下定义时间蕴涵:对于两个双时间知识图G1和G2,当且仅当对于每个t,G1(t) | = G2(t),G1 | = tG2,其中| = t表示时间蕴涵[13],| = 是标准RDF蕴涵。0时间化推理规则。从时间约束中提取Horn规则是非常困难的,并且在研究界得到了有限的关注。然而,0由于规则学习系统产生的大多数规则可以通过以下方式转换为时间规则:(i)为每个谓词添加四个变量v b,v e,t b和te,表示时间间隔的时间点(即,r(x,y)变为r(x,y,v b,ve,t b,te));(ii)如果体中的谓词数量大于一个,则引入一个算术谓词,用于测试时间重叠,即,0其中v,v'∈{vb,ve,v'b,v'e},t,t'∈{tb,te,t'b,t'e},[t,t']=[tb,te)∩[t'b,t'e)和[v,v']=[vb,ve)∩[v'b,v'e)。我们将此过程称为时态化推理规则。此外,我们将双时态知识图谱的不确定扩展称为概率双时态知识图谱。04 概率双时态知识图谱0正如前面讨论的,许多知识图谱包含概率事实,其中一些甚至包含时态信息(事务时间或有效时间)。在本节中,我们提出了概率双时态知识图谱的数据模型。04.1 数据模型0通过为知识图谱中的每个三元组添加双时态和概率信息,我们可以获得概率双时态知识图谱。这使我们能够对我们不确定其真实时间的数据进行建模,并记录数据添加到知识图谱的时间。概率双时态知识图谱包含一组带有置信度分数(可以是权重或概率值)的时态注释事实。0定义4.1(概率双时态知识图谱)。概率双时态知识图谱是一个元组K= (G,F),其中G ={(д,p1),...,(дn,pn)}是一个时态知识图谱,其中每个时态事实дi∈G具有概率pi;F ={(f1,p1),...,(fm,pm)}是表示背景知识或模式的有限一阶逻辑公式集合,其中每个pi表示公式fi的概率。0在本文中,我们将F限制为表示时态推理规则并使用Datalog语法表示它们的Horn公式。给定一个可能的世界K' = (G',F) �K,K'的概率由以下公式给出:0P(K')=�0G'∪F|=tдP(д)∙0F∪G\G'|=tд(1−P(д)),0其中|=t表示时态蕴涵关系。时态数据库中的一个重要问题是合并,我们在概率双时态知识图谱和时态查询中研究了这个问题。04.2 合并0合并是时态数据库中用于消除重复的技术[2,8]。合并对于:减小概率时态知识图谱的大小,以及防止查询评估中的错误答案非常有用。例如,考虑查询“John是否在2014年至2017年期间居住在巴黎?”在合并之前的图1的时态事实(a)和(b)。结果是否定的,然而,对于合并的事实(c)(图中的棕色部分),相同的查询返回肯定的答案。未合并的事实可能出现在各种情况下:通过投影或并集操作进行查询评估时,通过不强制在更新或插入操作中进行合并,以及通过从不同来源提取信息或提取器的准确性。在本节中,我们讨论概率时态知识图谱中的合并。0Track:第8届时态Web分析研讨会WWW 2018,2018年4月23日至27日,法国里昂a (John, livesIn, Paris, [2007, 2016), [2010, UC)), 0.9Paris from 2014 upto 2017?’ on the temporal facts of Figure 1 beforecoalescing, i.e., (a) and (b). The result is no, however, the same queryon the coalesced fact (c) (brown part of the figure), returns yes. Un-coalesced facts can arise in various cases: during query evaluationvia projection or union operations, by not enforcing coalescing inupdate or insertion operations, and through information extractionfrom diverse sources or accuracy of the extractor. In this section,we discuss coalescing in probabilistic temporal KGs.17600b�(John,livesIn,Paris,[2015,now),[2015,UC)),0.5�0图1:合并概率时态事实。now表示事实未发生变化,UC表示记录自添加到知识图谱以来未被修改。0定义4.2(合并)。如果两个概率双时态事实�r(s,o,vb,ve,tb,te),p1�,�r'(s',o',v'b,v'e,t'b,t'e),p2�可以合并,如果s =s',r = r',o =o',并且[vb,ve)和[v'b,v'e)(或[tb,te)和[t'b,t'e))的重叠部分非空。合并事实�r(s,o,v,v',t,t'),p3�的概率p3,其中[v,v')= [vb,ve)∪[v'b,v'e)(或[t,t')=[tb,te)∪[t'b,t'e))可以使用以下三种方法之一计算。0请注意,在我们的提议中,为了合并双时间事实,有效时间和事务时间间隔必须重叠。然而,为了计算合并事实的概率,我们只考虑事实的有效时间间隔的重叠。我们考虑这个假设是因为时间事实的概率表明我们对它们为真的时间不确定。概率计算可以根据需要或根据应用程序进行修改,例如,可以将p1和p2的最大值分配给合并的事实的概率。04.2.1基于Allen的区间关系的合并。在这种方法中,我们使用Allen的关系来合并事实并确定合并事实的概率。新合并的事实的概率可以是要合并的事实的最大值或平均值,选择取决于应用程序。Allen的关系被迭代应用直到闭包。04.2.2基于规则的合并。一种合并的方法是使用迭代的基于规则的技术。为了合并所有的0对于概率时间KG的事实,我们可以为KG中的每个关系构建Horn规则。因此,基于规则的合并可以按以下方式完成:对于概率时间KG K中的每个关系 r i ,迭代应用以下规则直到闭包:r i (x, y, v, v ′, t, t ′): − r i (x, y, v b, v e, t b, t e), r i (x, y, v ′ b, v ′ e, t ′ b, t ′ e), v =min(v b, v ′ b), v ′ = max(v e, v ′ e), v b ≤ v ′ e, v ′ b ≤ v e, t =min(t b, t ′ b), t ′ = max(t e, t ′ e), t b ≤ t ′ e, t ′ b ≤ t e。表达式 tb ≤ t ′ e, t ′ b ≤ t e 测试时间间隔[t b, t e]和[t ′ b, t ′e]的时间重叠。此外,min和max是表示最小值和最大值函数的谓词。该方法对于每个关系使用一条规则。如果KG有几百个关系,我们需要相同数量的合并规则来合并KG。因此,这个操作可能非常昂贵,但是它只需要执行一次。0示例2.考虑使用基于规则的方法合并图1中显示的概率双时间事实(a)和(b)。此操作将两个事实合并为一个新事实(c),新事实的概率为两个事实的最大值,即max(0.9, 0.5),这也可以在推理中学习到。04.2.3算法合并。合并概率时间事实的另一种方法是使用以下算法,该算法基于[2]中的结果。简而言之,该算法的步骤如下:对于每个关系r,搜索具有相同非时间(s,r,o)元素的所有时间事实,根据它们的时间段对这些事实进行排序,对于重叠的时间段,构建最大时间段(时间段的并集),删除时间段包含在最大时间段中的时间事实,最后为合并的时间事实分配概率。我们将规则方法与算法方法的比较作为未来的工作。05 实验0我们进行了两个不同的实验:(i)边际推理和(ii)MPE推理。对于这两个实验,我们进行了运行时间的性能测试。我们在一台Debian8虚拟机上运行实验,该虚拟机配有2.6GHz 3核IntelHaswell处理器,24GB主存储器和1TB磁盘空间。工具。我们使用ProbLog系统进行实验。ProbLog是Prolog的概率扩展[15]。ProbLog使用一种称为grounding的技术(将推理规则和查询中的所有变量与所有可能的常量进行实例化),可以显著减少地面规则的数量。因此,我们选择ProbLog来执行边际和MPE推理任务。数据。对于我们的实验,我们使用Wikidata知识图。特别是,我们提取了包含结构化时间信息的KG的一部分(使用开放信息提取从各种来源获得)。我们提取了各种流畅关系的时间事实,包括:playsFor,educatedAt,memberOf,occupation,spouse等。总体而言,我们从Wikidata中提取了超过670万个时间事实。所有这些时间事实都是时间间隔时间戳(有效时间)。下面是数据的摘录:0"Q23","P26","Q191789","1759","1799"。"Q23","P39","Q11696","1789","1797"。"Q23","P39","Q1115127","1789","1797"。"Q23","P39","Q1115127","1798","1788"。0论文:第8届时间Web Analytics研讨会WWW 2018,2018年4月23日至27日,法国里昂01,0002,0003,0004,0005,000020040060001,0002,0003,0006570758017610数据大小0运行时间(秒)0(a)边际和MPE推理。0边际0MPE00 0.5 1 1.5 2 × 10^50数据大小0运行时间(秒)0(b)可扩展性测试。0缩放边际00 0.5 1 1.5 2 × 10^50数据大小0运行时间(秒)0在ProbLog中对知识库进行接地的运行时间0接地0图2:ProbLog在固定查询和不同数据大小下的运行时间性能。0"Q23","P39","Q1115127","1789","1797"。0Q23、P26和P39是GeorgeWashington、配偶关系和职位关系的Wikidata简写。此外,Q191789、Q11696和Q1115127是MarthaWashington、美国总统和美国指挥将军的简写。第四和第五列表示每个关系的有效时间。例如,第一行可以读作“GeorgeWashington的配偶是MarthaWashington,从1759年到1799年”。由于Wikidata是一个有效时间知识图,为了进行实验,我们通过为每个事实添加事务时间间隔和概率来扩展它,以获得一个概率双时态知识图。我们随机生成事务时间和概率(>0.5)。此外,由于Wikidata不完整,它并不包含所有事实的有效时间。如果一个事实的结束时间点缺失,我们用“现在”替换它。例如,以下事实的结束时间(第五列)缺失:GeorgeWashington(Q23)于1976年获得了美国军队的将军军衔(P410)。0"Q23","P410","Q3100539","1976",""。0变为0"Q23","P410","Q3100539","1976","现在"。0时间规则。我们设计了36个不同的基于Wikidata的概率时间推理规则(ProbLog确定子句),这些规则基于Wikidata的流变(时间变化的关系)。规则的概率是随机生成的,设置在0.5到0.99之间。以下是一些规则的示例(以ProbLog语法表示):(i)配偶(P26)关系是已婚关系的子属性。00.95::married(X, Y, Vb, Ve, Tb, Te):-P26(X, Y, Vb, Ve, Tb, Te).0(ii)一个人可能居住在他受教育的大学所在的城市。00.5::livesin(X, Z, V, V, Tb, Te):-P69(X, Y, Vb, Ve, Tb, Te), P131(Y, Z, Vbp, Vep,Tbp, Tep), Vis max(Vb, Vbp), Vis min(Ve, Vep), Vb @<= Vep, Vbp @<=Tep.0请注意,不进行交易时间间隔的重叠测试。如果需要,可以添加。另一个重要的问题是新推断出的事实(居住在)的交易时间将是什么。0在我们的情况下)。在上述规则中,livesin的事务时间是关系P69的区间。然而,根据需要也可以设置为其他值,例如[current date,UC)。05.1 MPE推理0MPE推理是概率推理中最重要的任务之一。它等同于在给定证据/数据的情况下计算最可能的一致双时态知识图。在这个实验中,我们报告了ProbLog在不同数据大小上的运行时间
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- SSM Java项目:StudentInfo 数据管理与可视化分析
- pyedgar:Python库简化EDGAR数据交互与文档下载
- Node.js环境下wfdb文件解码与实时数据处理
- phpcms v2.2企业级网站管理系统发布
- 美团饿了么优惠券推广工具-uniapp源码
- 基于红外传感器的会议室实时占用率测量系统
- DenseNet-201预训练模型:图像分类的深度学习工具箱
- Java实现和弦移调工具:Transposer-java
- phpMyFAQ 2.5.1 Beta多国语言版:技术项目源码共享平台
- Python自动化源码实现便捷自动下单功能
- Android天气预报应用:查看多城市详细天气信息
- PHPTML类:简化HTML页面创建的PHP开源工具
- Biovec在蛋白质分析中的应用:预测、结构和可视化
- EfficientNet-b0深度学习工具箱模型在MATLAB中的应用
- 2024年河北省技能大赛数字化设计开发样题解析
- 笔记本USB加湿器:便携式设计解决方案
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功