没有合适的资源?快使用搜索试试~ 我知道了~
关系数据库管理系统中RDF/OWL存储和管理的比较研究
制作和主办:Elsevier沙特国王大学学报关系数据库管理系统中RDF/OWL存储和管理的比较研究Bouchra El Idrissia,b,Salah Baïnab,Anass Mamya,Mina Elmaallama,caESI,BP 6204 Rabat,MoroccobAlqualsadi(数字和企业架构创新)研究团队,ADMIR实验室,拉巴特IT中心,ENSIAS,拉巴特穆罕默德五世大学,BP 713拉巴特,摩洛哥cIMS(IT架构和模型驱动系统开发)研究团队,ADMIR实验室,拉巴特IT中心,ENSIAS,拉巴特穆罕默德五世大学,BP 713拉巴特,摩洛哥阿提奇莱因福奥文章历史记录:2021年3月26日收到2021年6月18日修订2021年8月17日接受2021年10月7日网上发售保留字:RDFOWLSPARQL查询SPARQL更新关系数据库语义网存储A B S T R A C T本文详细介绍了Oracle和Virtuoso这两个流行的关系数据库管理系统中RDF/OWL的存储和管理流行性、可持续性和与SPARQL语言的一致性是选择这些系统的主要原因。这项工作结合了实证和分析研究的比较框架的指导下,开发和激励的文件。考虑了几个方面,包括RDF数据类型保存,SPARQL查询和更新处理,推理能力,自定义推理,空白节点管理,以及其他功能和非功能特性。此外,在文献中报告的性能评估的审查已经进行。这项研究它们可以帮助改进这些系统,或者作为在项目环境中选择适当系统的指南进一步研究工作的机会也提出了建议。版权所有©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。内容1.动机与动机76052.背景资料76062.1.RDF(S)和OWL 76062.2.SPARQL查询和更新76062.3.推理和SPARQL蕴涵机制76073.方法和材料76073.1.研究方法76073.2.指导分析框架76073.3.引导图示例76084.用于RDF/OWL存储和管理4.1.系统识别4.2.RDF在virtuoso中的存储和管理(7.2.5)76094.2.1.一般信息76094.2.2.RDF存储模型76104.2.3.SPARQL查询和更新管理76104.2.4.推理能力和技术7611*通讯作者:ESI,BP 6204 Rabat,Morocco.电子邮件地址:bel-idrissi@esi.ac.m(B. El Idrissi)。沙特国王大学负责同行审查https://doi.org/10.1016/j.jksuci.2021.08.0181319-1578/©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comB. El Idrissi,S.Baïna,A.Minghy等人沙特国王大学学报76054.2.5.索引和压缩机制76114.3.Oracle19c 7611中的RDF存储和管理4.3.1.一般信息76114.3.2.存储模型76114.3.3.SPARQL查询和更新管理76134.3.4.推理能力和技术76144.3.5.索引和压缩机制76155.分析与讨论76156.相关文章76187.结论7618参考文献76191. 导言和动机资源描述框架(RDF)数据规模的增长对其有效存储和管理提出了挑战RDF存储(RDF存储是指提供RDF数据的持久存储和访问的任何RDF管理系统(Cheng等人, 2016))已经从使用平面文件和存储器的原生三元组存储发展到基于关系数据库的非原生三元组存储(Faye等人, 2012),图形数据库(Özsu,2016; Wylot等人,2018)以及最近在多模型NoSQL数据库上集成单个数据库系统中的不同数据模型(Faye等人,2012; Özsu,2016; Wylot等人,2018;Pan等人, 2018年)。一方面,本机将加载数据存储在内存中,并直接从/向磁盘读取/写入数据。然而,正如数据库管理领域中众所周知的那样,这些系统具有性能缺陷,并且不能用于大型数据集。因此,对于大规模数据集,强烈建议使用数据库管理系统(DBMS)以及优化内存和磁盘使用的技术另一方面,一些研究建议利用分类在分布式RDF管理系统类别下的云和大数据技术(Özsu,2016;Wylot等人,2018年)。这一类别提供了容错和高可扩展性,但由于将MapReduce适应于图形计算,可能会降低性能(Özsu,2016)。而基于图的方法维护RDF和SPARQL查询的图模型然而,这种方法是基于使用同态的子图匹配(Zou和Özsu,2017),这是一个众所周知的计算成本高的NP完全问题(Özsu,2016年)。Santana和Mello(2020)进行的实验表明,从RDF到图模型的映射策略是直接的,但比映射到平面三元组等其他策略慢该调查(Ma等人,2016)已经表明,使用NoSQL作为RDF存储,索引和分区是具有挑战性的。复杂的SPARQL查询(即,具有大量连接和三元组模式的查询(最终跨越多个不相交的分区)会产生值得注意的中间数据重排,并严重影响分布式RDF查询引擎(Hammoud例如,2015; Abdelaziz等人,2017; Michel等人,2019年)。一些方法提出仅划分SPARQL查询,如DREAM系统(Hammoud等人,2015年),以避免数据分区的问题。该工具使用查询规划器来有效地划分任何SPARQL查询,并将完整的数据集存储在集群中的每台机器上。使用RDF数据统计信息的基于成本和基于规则的查询规划器来完成划分。它还通过仅交换控制消息和一些元数据来依赖于节点之间的最小通信。DREAM允许在集群中的每台机器上使用任何模型和任何RDF存储。因此,这些分布式系统可以依靠关系存储来查询单个机器内的RDF数据该研究(Can等人,2017)根据加载时间、查询响应时间和基础设施容量,比较了AllegroGraph 1和Oracle 12c的医疗保健信息。结果表明,这两个系统有效地响应查询。对于数据加载,Oracle 12c 比AllegroGraph 慢 , 但 对 于 数 据 查 询 , Oracle 比 AllegroGraph 快 。Saikaew等人(2014)的作者比较了MongoDB2及其查询语言的查询性能与在MySQL3和Apache Jena TDB4中查询等效SQL数据集和RDF的性能。根据这个实验,MySQL在具有复杂过滤器、子查询和连接的查询方面优于其他系统。最近的研究进行的实验(Cheng et al.,2019)表明,关系型DBMS(RDBMS)在主要由分组、聚合操作、排序及其组合组成的工作负载下,性能大大优于图形DBMS。相比之下,图DMBS在由多表连接、路径识别、模式匹配以及它们的组合组成的工作负载下表现得更好所以,主要结论是,可以得出的是,这些类型的数据库是可比的,每一个都表现出自己的弱点和优势。在多模型数据库中存储RDF仍处于早期阶段(Holubova和Scherzinger,2019; Holubova和Scherzinger,2020)。这些作品(Samuelsen,2018; Holubová和Scherzinger,2019)说明了使用多模型数据库进行RDF数据存储,并通过研究从SPARQL到AQL(AllegroGraph的查询语言)的查询转换(Cutajar,2020RDBMS在高效数据管理方面有着悠久的历史具有相关的优点,例如事务处理、安全性、查询优化、一致性检查和数据完整性。此外,RDBMS已经显示出它们支持不同类型的数据(诸如时空数据)的有效管理的能力(Lian等人,2018)和XML(Qtaish和Alshammari,2019)。此外,经验表明,RDB可以扩展到10亿个三倍(W3C,2020)。此外,RDB的水平缩放现在是可能的。Citus5是Postgres6的扩展,旨在将Apache Spark7的大数据处理与可变性集成在一起。此扩展淹没了可应用于其他数据库的体验一般来说,处理任何关系数据库中托管的数据都可以使用标准数据库驱动程序和Spark框架抽象层来完成。然而,关系模型和RDF模型之间的差异提出了一个问题,即使用哪种关系模型来存储RDF数据,其主要目标是保持高效的存储和查询处理。1https://allegrograph.com/products/allegrograph/(2021年2月19日访问)。2https://www.mongodb.com/(2021年2月19日3https://www.mysql.com/(于二零二一年二月十九日查阅)。4https://jena.apache.org/index.html(2021年2月19日访问)。5https://www.citusdata.com/(于二零二一年二月十九日查阅)。6https://www.postgresql.org/(2021年2月19日访问)。7https://spark.apache.org/(2021年2月19日访问)。B. El Idrissi,S.Baïna,A.Minghy等人沙特国王大学学报7606本文重点介绍了支持RDF/OWL存储和管理(而不是特定于特定领域的地理空间RDF存储)的通用RDBMS,它完全符合SPARQL规范,这是唯一的万维网联盟(W3C)查询RDF/OWL数据的标准语言。在关系数据库(RDB)中管理和存储RDF/OWL然而,这项研究强调,只有两个RDBMS维护到目前为止的研究。所确定的系统可供公共用户使用,但有一些限制。如第4.1节所述,这些系统是Oracle和Virtuoso。研究的目的是比较RDF/OWL在这些系统中的存储和管理为此,制定了一个指导性分析框架。它包括与SPARQL查询和更新操作的处理、RDF数据类型保存、推理和空节点管理相关的几个维度。此外,还审查了关系数据库特有的一些维度,以分析其影响RDF数据。研究结果可以帮助改进这些系统,并为项目环境选择合适的系统。此外,还对现有工作进行了审查,以将这些发现与涉及这些系统的性能评估研究和基准进行比较。这篇综述提出了一些差距,未来的研究可以调查。本文的其余部分组织如下。第2总结了本文中用到的相关标准和概念,即RDF、OWL、SPARQL以及推理原理和技术。在第三部分中,详细介绍了研究方法,并提出了指导性的分析框架。第4节报告了这些研究结果和对每个确定的系统进行的经验评估。第5节还讨论了主要调查结果。第6节回顾了相关工作。最后一节总结了本文的未来研究机会。2. 背景资料RDF 语言(Hayes 和Patel-Schneider,2014)、OWL 2语言(Boris等人,2012)、SPARQL查询(Harris等人,2013)和SPARQL更新(Gearon等人,2013年)在其官方网站上发布。在本节中,我们简要回顾了本文分析中使用的一些概念2.1. RDF(S)和OWLRDF数据模型基于Web资源在三元组{主语、谓语、宾语}下的表示。三元组的集合被称为RDF图,其中对于每个三元组,主语和宾语表示节点,谓词是从主语到宾语的弧。在RDF图中,考虑了三种类型的节点:(i)国际化资源标识符(IRI),它是RDF 1.0中定义的统一资源标识符(URI)的概括,允许使用非ASCII字符;(ii)文字;(iii)空白节点。与IRI和文字相反,空白节点(后面缩写为BN(s))不标识资源。BN反映了逻辑中存在量化变量的使用(没有明确身份的存在)。三元组的主语可以是IRI或BN。谓词必须由IRI标识,而三元对象可以是IRI、文字或BN。 两种类型的文字是distinguished:平原和类型。 类型化文字包括字符串和数据类型IRI(例如, 大多数数据类型是采取从的XML模式数据类型(XSD)(拜伦和Malhotra,2004)。普通文字没有数据类型。它可选地定义指示内容的自然语言的语言标签(例如,‘‘foo"它在第二种情况下被自己解释。语言标签被定义或以其它方式被定义为一对(例如, 此外,RDF还定义 了一 些特定 的数 据类型 ,如rdf:XMLLi tera l 、 rdf:HTML、rdf:lanSt ring,用于表示XML、HTML和带有语言标记的字符串值内容在OWL 2本体中。然而,这些类型仍然在非规范性部分。RDF的形式语义表明,每个三元组编码一个语句,该语句可以被转换为简单的逻辑表达式。这个表达式声明由谓词设计的特定关联链接由主语表示的资源,对象。每个谓词表示一个二元关联,不能链接两个以上的资源。在RDF的1.1版本中,定义了一些特殊的关系:具体化、集合(例如,rdf:List),它是一个包含有序元素的封闭集合,容器(例如,rdf:Sequence,rdf:Bag)是打开列表,没有秩序。尽管这些关系后来已经从RDF规范的规范性部分中撤回,但它们可以用于多个例如,具体化是一种允许描述RDF三元组的 它已被广泛用于知识库Yago2(Hoffart等人, 2013)提供关于语句 的 时 间 和 空 间 信 息 。 此 外 , 通 常 建 议 记 录 出 处 信 息 和 信 任(McKenna等人,2019; Sikos和Philp,2020)。用SPARQL查询容器很麻烦(Hartig,2017),SPARQL规范中没有给出细节 对于集合,通过SPARQL进行查询是可能的,尽管它不是直接的(Daga等人, 2019年)。RDFS是RDF的扩展,用于捕获更多的领域语义,如分类和类成员关系 。 在 这 个 意 义 上 , W3C 已 经 定 义 了 OWL ( Ontology WebLanguage)作为RDFS词汇表的扩展,它有一个逻辑层,允许对知识进行 推 理 ( 仅 专 用 于 OWL 的 一 个 子 集 , 相 当 于 描 述 语 言 ( DL )(Rudolph,2011))。例如,OWL允许描述不相交和对称关系、基数、相等和枚举类。此外,它还区分了数据和对象属性。 两者都是次-rdf的类:属性,但前者将个体链接到数据值(文字),后者将它们链接到个体。需要注意的是,OWL本体主要作为RDF文档进行交换,因为每个OWL文档都可以序列化为RDF文档。我是说。因此,本文后面将使用术语RDF数据来指代RDF或OWL(RDF/OWL)数据。2.2. SPARQL查询和更新SPARQL在2008年被标准化为查询RDF数据的语言。SPARQL查询由一组称为基本图模式(BGP)的三元组模式组成。SPARQL中的三元组模式类似于RDF三元组,不同之处在于每个三元组元素都可以是一个变量。查询评估机制是基于BGP和数据图之间的子图匹配。匹配机制评估来自RDF数据子图的RDF项何时可以替换变量。查询结果列出了变量到数据图中RDF术语的可能绑定。SPARQL有四种类型的查询:(i)SELECT用于投影,其中结果显示在值表(JSON或XML)中;(ii)CONSCRIBE,在这种情况下,结果是任何RDF序列化中的一组RDF三元组;(iii)DESCRIBE,用于描述给定变量匹配的资源(列出属性及其值);(iv)询问是否有任何匹配以及结果是真还是假(JSON或XML)。通过使用内置的操作符和函数(如可选、联合和过滤操作符),可以从BGP构造更B. El Idrissi,S.Baïna,A.Minghy等人沙特国王大学学报7607SPARQL 1.1 Update定义了如何使用SPARQL操作更新RDF数据。 更新操作分为两类:更新RDF三元组和更新RDF图。for- mer定义了两个update语句:到一个RDF图和删除它们,如果相应的图包含这些三元组。要添加或删除的三元组要么在请求中显式(内联)给出,要么基于WHERE子句匹配的绑定该命令允许将这两个操作合并到一个请求中以更改数据。三元组不能直接更新;必须先删除,然后再添加。对于图管理,LOAD操作从IRI读取RDF文档,并将其三元组插入RDF存储中的指定图中,而CLEAR操作则删除它们。2.3. 推理和SPARQL蕴涵机制推理允许从断言的RDF三元组中推断出新的RDF三元组。它是语义网的一个关键特征。推理三元组是应用某些推理模式的逻辑结果或规则(称为蕴涵关系)。这些规则分为基本的RDF(S)规则、更高级的OWL 2概要文件或特定的规则语言。 SPARQL查询的行为,涉及推理规 则 , 在 SPARQL 的 可 选 扩 展 中 指 定 , 称 为 SPARQL 约 束 机 制(Glimm等人,2013年),基于W3C蕴涵机制:RDF(S),OWLDirect,RIF Core和基于RDF的语义。SPARQL蕴涵机制定义了蕴涵关系、格式良好的查询和图以及可能发生的错误类型(Glimm等人,2013年)。在无蕴涵机制下,SPARQL不执行任何推理。SPARQL更新没有为蕴涵机制定义任何标准行为。W3C建议对更新操作中涉及的存储图进行一致性检查。在检测到不一致的情况下,系统必须向用户返回明确的错误文献中区分了两种着名的推理方法:向后和向前链接(Mzori,2015)。前向链接是一个数据驱动的概念,系统首先分析事实(数据)来推断目标。相比之下,前向链接是一个目标驱动的概念,对人类专家来说,目标是针对现有的事实。这些方法之间的另一个区别涉及事实的具体化。前向链接在查询时临时实现,而前向链接通常在加载时持久地实现事实。3. 方法和材料3.1. 研究方法本研究采用定性与定量相结合的方法。定性的方法是通过文献回顾来识别相关的关系RDF存储和一些技术上的结果报告定量的方法是用设计研究方法来概念化一个基于分类标准的比较框架,并在选定的系统上进行实验。本研究分四个阶段进行。第一阶段的目标是确定现有的和分级的RDBMS,用于RDF存储管理,可用于研究和工业项目。对提供RDF商店分类的文献和在线信息源进行了审查。兴趣是搜索符合SPARQL规范的系统,重点是自2008年SPARQL标准化以来发表的文献。筛选标准为:完全符合SPARQL规范,通用性意味着系统不专用于特定领域、可用性和可持续性。本研究的动机是探索RDBMS可以在多大程度上,一方面,满足管理灵活和大型RDF数据的挑战,另一方面,利用软件技术的特点进行语义查询处理和推理。为此,我们通过以下研究问题进行了研究:1. 存储模型是否能够保存任何RDF数据?2. 是否保留了有关此数据的所有详细信息,并且可以在以后按原样导出?3. BN如何管理?4. 如何处理SPARQL查询?5. 这些系统的推理技术和能力是什么?6. 高效访问和存储空间管理所需的索引和压缩机制如何第二阶段的重点是建立一个框架,界定如何回答这些问题。这一框架还指导对所审议的制度进行比较。第三阶段,对正式制度文件进行了系统的审查。此外,安装了最新发布的版本,以检查是否符合发布的信息。如果信息不明确或无法获得,则与社区成员进行沟通。此外,还对这些系统的已发表文献进行了综述。最后一个阶段的目的是分析研究,这些系统的经验评估报告。目的是丰富和比较本研究的结果。最近的RDF基准调查是识别涉及Oracle和Virtuoso评估的研究的起点。如果在调查中无法获得有关被评估系统的信息,则立即对基准进行调查。此外,公开的应用研究比较这些系统进行了探讨。3.2. 指导性分析框架本节将激励并详细说明为评估已识别的RDF关系存储而选择的分类标准。每个标准都与研究问题相关,编号相同1. RDF灵活性:评估关系数据模型是否能够处理RDF数据模型的灵活性。RDF数据集是动态的,这意味着可以通过添加或删除类、属性和关系来不断修改它们。该准则的评价是基于对所识别系统的关系数据模型的分析。2. 数据类型保存:保存RDF文本的数据类型是必要的,原因有很多,包括RDF数据检索和文本比较。首先,要导出原始输入中存储的RDF数据,系统应该能够用相应的数据类型或语言标记(如果定义了)重构其次,对于数据类型比较,在没有蕴涵的情况下,RDF和OWL认为只有当它们的词法形式和数据类型相等时,文字才相等(Emmons et al.,2011年)的报告。这意味着两个类型化文字是相等的,只要它们具有相同的词法形式和相同的数据类型URI。D-蕴涵机制(Glimm等人,2013)扩展了这一规则,如果两个字面值具有相同的词法形式和相同的原始数据类型,则认为它们相等。基元数据类型不是另一个数据类型的细化例如,XML Schema中的数据类型long是从数据类型integer派生的,integer又是从作为基元类型的decimal数据类型派生D蕴涵改进了RDF数据的互操作性,因为它减少了作者做出的句法选择的(非预期的)影响(Emmons等人, 2011年)的报告。B. El Idrissi,S.Baïna,A.Minghy等人沙特国王大学学报76083. BN范围管理:回想一下,这些节点没有分配IRI,必须分配本地范围标识符。根据SPARQL规范,在RDF图中可以使用相同的标识符来引用相同的BN。然而,共享之间的RDF图形BN是不允许的,除非在RDF数据集中提供的图形当在RDF图中遇到BN时,它可以表示简单的未命名资源或中间资源,以建模一些专门的关系,例如reification,collections和复杂属性。RDF存储必须生成用于存储BN的标识符,并维护对数据集或应用程序定义的范围中的图之间共享的BN的引用。4. SPARQL查询和更新处理:在关系RDF存储上执行SPARQL查询主要涉及将SPARQL查询转换为SQL查询。SPARQL社区受到SQL设计哲学的启发。除了一些不太清楚的情况外,该社区使用熟悉的SQL术语作为SPARQL构造,这使得在语言运算符之间进行映射变得容易(参见Kaminski et al.,2017年)。对SPARQL和SQL之间不匹配的调查超出了此外,我们考虑一些一般的标准,如缩放和可用性。它们对于存储大型RDF数据和使用系统非常重要。3.3. 引导图示例下面的图形示例说明了这种分析的一些关键方面,主要是SPARQL查询和更新处理、数据类型保存和BN管理。三个图被认为是关于事件,文章和作者。每个事件都有一个标题,一个国家的财产记录其位置,除了其注册价格。对于作者,描述仅限于全名和年龄。文章的属性包括标题、第一作者、共同作者列表以及最终的相应事件.还定义了两个BN:一个简单,另一个表示为复杂类型(列表)。这些图的插入可以通过将这些图合并成单个图来一次全部插入。它也可以在时间上分开,以验证所研究的系统维护图之间关系的能力。本文重点将放在SQL的复杂性上生成的查询。这种复杂性是通过查询中涉及的连接和表的数量来衡量的。此外,除了反馈查询之外,还支持直接SPARQL协议端点(对存储的三元组进行操作的基于HTTP的查询)(Prud'hommeaux等人, 2013年,被调查。5. 推理及其解释:其目的是确定每个系统的推理能力,支持自定义推理规则和一致性检查。此外,支持的链接模式是一个关键的技术方面进行调查。与外部推理服务集成的能力也是一个有趣的特征,因为已经开发了几个独立的推理应用编程接口(API)和系统(例如,客户端API,如Jena8、RDF4J9和Hermit10)。解释是指系统解释如何通过推理路径获得推断事实的能力。虽然此选项会降低系统的性能,因为它会生成更多数据并消耗更多资源,但它有助于增加用户的信任,并且对于某些应用程序来说是必要的6. RDF索引和压缩:在本研究的上下文中,索引RDF的问题是指索引关系数据的问题,因为RDF数据存储为关系数据,并不保留其图形性质。然而,从SPARQL转换发出的SQL查询涉及存储quad的表上的许多自连接,以及到其他表的附加连接(参见第4.2.3节和第4.3.3节)。因此,需要适当的索引来支持查询应答。关系数据库中的索引在查询性能中起着关键作用。然而,众所周知,索引消耗存储空间并损害DML(数据操纵语言)操作的性能。在这样的操作中,不仅数据必须更新,而且非聚集索引也必须更新。从文献综述可以得出结论(Weiss等人,2008; Luo等人,2012; Vlachou,2017),在关系数据库下索引RDF的几种解决方案存在,每种都有其优点和缺点。本研究确定和比较所研究的系统支持的索引类型。它还强调了重复管理和数据压缩以减少存储空间利用率所遵循的策略。8https://jena.apache.org/index.html(于二零二一年二月十九日查阅)。9https://rdf4j.org/(2021年2月19日访问)。10http://www.hermit-reasoner.com/(于2021年2月19日查阅)。--(a)关于作者的TBox1. PREFIX a:http://author.example.com/>2.a:author rdf:type rdfs:Class.3.a:fullname rdf:type owl:DatatypeProperty;4.rdfs:domain a:author;5.rdfs:range xsd:string。6.a:age rdf:type owl:DatatypeProperty;7.rdfs:domain a:author;8.rdfs:range xsd:integer。--关联ABox9.a:author1 a:fullname10. a:author1a:age''40“^ ^ xsd:integ e r.11.a:author2 a:fullname''ADAM Y”^^ xsd:string.12.a:author3 a:fullname''MERY Z”^^ xsd:string.--(b)关于事件的TBox13.PREFIX e:www.example.comhttp://event.example.com/14.e:event rdf:type rdfs:Class.15.e:conference rdf:type rdfs:Class.16.e:conference rdfs:subClassOf e:event.17.e:title rdf:type owl:DatatypeProperty;18.rdfs:domain e:event;19.rdfs:range rdf:PlainLiteral.20.e:country rdf:type owl:DatatypeProperty;21.rdfs:domain e:event;22.rdfs:range xsd:string。23.e:studentPrice rdf:type owl:DatatypeProperty;24.rdfs:domain e:event;25.rdfs:rangexsd:decimal.--关联ABox26._:event1 rdf:type e:conference.27._:event1 e:title“Congr é sWeb S é mantique”@ fr.28._:event1e:country''Maroc”^^ xsd:string.29._:event1e:studentPrice30.e:event2 rdf:type e:event.31.e:event 2e:title32.e:event2 e:country--(c)关于文章的TBox33. PREFIX r:http://article.example.com/>34. PREFIX a:http://author.example.com/>35. PREFIXe: 36. r:article rdf:type rdfs:Class.B. El Idrissi,S.Baïna,A.Minghy等人沙特国王大学学报760937. r:titlerdf:type owl:DatatypeProperty;38.rdfs:domain r:article;39.rdfs:range rdf:PlainLiteral.40. r:firstauthor rdf:type owl:ObjectProperty;41.rdfs:domain r:article;42.rdfs:range a:author.43. r:event rdf:type owl:ObjectProperty;44.rdfs:domain r:article;45.rdfs:range e:event.46. r:coauthors rdf:type rdf:List.47. r:article1 rdf:type r:article.48. r:article 1r:title“XYZ的研究”@en。49. r:article1 r:event_:event1.50. r:article1 r:coauthors(a:author2 a:author3).51. r:article1 r:firstauthor a:author1.此外,还将考虑以下SPARQL查询和更新操作,并将在本文的后面进行介绍--(SQ 1)一个SPARQL查询的例子,请求--事件。PREFIX e: SELECT?在哪里?srdf:type e:event. }--(UQ 1)SPARQL更新操作示例--查询将文章添加到_:event 1PREFIXr: PREFIXe: 数据库{r:article2rdf:type r:article.r:article 2 r:title“ABC的实际评估”@en。r:article2r:event_:event1. }4. 用于RDF/OWL存储和管理的RDBMS4.1. 系统识别DB引擎11收集并呈现关于DBMS的信息,并且根据它们的流行度和所支持的数据模型(例如,关系、键值存储、图)。根据DB-Engines的说法,RDB继续占据主导地位。在2020年12月 DB-Engines的RDF存储排名中,确定了22个系统,包括三个关系RDF存储:Oracle,IBMDB212和Virtuoso。IBM DB2中对RDF的支持是在9.7版中引入的但是,IBM在DB2 11.1版本中宣布RDF已被弃用,并且可能不会出现在未来的版本中。在本文的最后一个版本中没有RDF支持,11.5. 因此,本研究中不考虑IBM DB2在DB-Engines中排名的RDF框架是Jena TDB和RDF 4J。Jena是一个流行的开源Java框架,用于构建语义Web应用程序。它为RDF存储和查询提供了两个组件:Jena TDB和Jena SDB。前者是直接存储到磁盘的本机后者由RDBMS备份,包括开源数据库(例如,MySQL、PostgreSQL)merly Sesame)最初支持三种存储模型:内存、本机和作为后端的数据库RDF4J的官方技术文档指出,该框架的当前版本仅支持内存和本机存储模型。已 经 发 展 了 几 个 与 RDF4J 兼 容 的 第 三 方 数 据 库 实 现 , 例 如Strabon13,它是一个spatiotemporal RDF存储,扩展了RDF4J组件来管 理 存 储 在 RDBMS 中 的 空 间 , 时 间 和 主 题 数 据 。 该 系 统 使 用stSPARQL ( Koubarakis 和 Kyzirakos , 2010 ) 和 GeoSPARQL(Battle和Kolas,2011)来查询stRDF(Koubarakis和Kyzirakos,2010)中表示的数据,这是RDF的扩展。已经出现了一组特定的RDFJavaScript库;然而,最近的W3C比较研究(W3C,2019)表明,所有这些库都基于内存存储模型。已经有几篇文章对RDF管理系统进行了研究(见第6)。 一些报告的关系RDF存储要么不再活跃(参见Haslhofer等人,2011)或商业解决方案,如语义平台智能14。该系统不提供有关底层存储模型的信息,因此对本研究兴趣不大。Curé和Blin(2014)提出了一个RDF存储的时间线,分为两个主要类别(总共50个系统):原生(基于磁盘或内存存储)和使用数据库(关系或NoSQL)作为存储后端的非原生。在14个非原生和RDB支持的系统中,只有两个被确定为生产就绪:Oracle和Virtuoso。正如作者所声称的那样,RDBMS支持的RDF存储是第一个出现的,但自2009年以来,原生和NoSQL系统已经成为趋势。我们通过检查调查中研究的关系RDF存储来检查这一结论(Özsu,2016;Albahli和Melton,2016; Wylot等人,2018; Pan等人, 2018年)。事实上,几乎所有这些系统都包括在时间轴中,并在2000年至2009年之间发布。作为一个例外,我们引用了IBM DB2中实现的DB2RDF方法(Bornea et al.,2013年),并于2013年发布。基于上述研究结果,符合这些研究标准的唯一系统,主要是学术和工业项目的可持续性和可用性,是Oracle和Virtuoso。4.2. RDF在virtuoso中的存储和管理(7.2.5)4.2.1. 一般信息Virtuoso 有 两 个 版 本 : 一 个 商 业 版 本 称 为 Virtuoso EnterpriseEdition,后来缩写为VEE(试用版有限期),一个开源版本称为Virtuoso Open- Link Software,后来缩写为VOS。术语Virtuoso将用于指这两个版本。在撰写本文时,最新的VEE和VOS版本分别是8和7。这两个版本都支持RDF管理。与商业版不同,VOS版不支持集群(VOS是单机版)、虚拟化、数据复制、安全策略和自定义推理规则等功能。全文搜索和高级空间索引都可以通过SPARQL内置函数在两个版本中使用。许多大型关联数据集目前都由Virtuoso托管(其中大多数使用VOS版本),例如用于将生命科学数据映射到关联数据的Bio2RDF15,DBpedia16和US。政府开放数据17和LOD云缓存18。Virtuoso通常部署为服务器,称为Virtuoso通用服务器,操作系统进程与内存和文件存储交互。Virtuoso最初被设计为行存储事务数据库和专有的(例如,Oracle、Microsoft SQL Server)。耶拿正如耶拿的官方网站上宣布的那样,SDB不再由耶拿维护Jena官方推荐使用Jena TDB而不是SDB。因此,本研究排除了这一框架RDF 4J(用于-11http://db-engines.com/en/(于2021年2月19日查阅)。12https://www.ibm.com/products/db2-database(2021年2月19日访问)。13http://www.strabon.di.uoa.gr/(2021年2月19日访问)。14http://www.intellidimension.com/products/semantics-platform/(2021年2月19日访问)。15https://bio2rdf.org/(2021年2月19日访问)。16https://wiki.dbpedia.org/(于2021年2月19日查阅)。17https://www.data.gov/(2021年2月19日访问)。18http://lod.openlinksw.com/fct/(2021年2月19日访问)。B. El Idrissi,S.
下载后可阅读完整内容,剩余1页未读,立即下载
![application/pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![application/pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- VMP技术解析:Handle块优化与壳模板初始化
- C++ Primer 第四版更新:现代编程风格与标准库
- 计算机系统基础实验:缓冲区溢出攻击(Lab3)
- 中国结算网上业务平台:证券登记操作详解与常见问题
- FPGA驱动的五子棋博弈系统:加速与创新娱乐体验
- 多旋翼飞行器定点位置控制器设计实验
- 基于流量预测与潮汐效应的动态载频优化策略
- SQL练习:查询分析与高级操作
- 海底数据中心散热优化:从MATLAB到动态模拟
- 移动应用作业:MyDiaryBook - Google Material Design 日记APP
- Linux提权技术详解:从内核漏洞到Sudo配置错误
- 93分钟快速入门 LaTeX:从入门到实践
- 5G测试新挑战与罗德与施瓦茨解决方案
- EAS系统性能优化与故障诊断指南
- Java并发编程:JUC核心概念解析与应用
- 数据结构实验报告:基于不同存储结构的线性表和树实现
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)