没有合适的资源?快使用搜索试试~ 我知道了~
大学中的链接数据Karima Rafes引用此版本:Karima Rafes。大学中的链接数据:LinkedIn Wiki平台。网络。巴黎萨克雷大学(COmUE),2019年。法语。NNT:2019SACLS032。电话:02003672HAL ID:电话:02003672https://theses.hal.science/tel-02003672提交日期:2019年HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire大学中的链接数据LinkedIn维基平台在南巴黎大学准备的巴黎萨克雷大学博士论文第580号博士学院博士专业:网络、信息和通信论文在伊维特河畔吉夫发表并答辩,2019年1月25日,通过Karima Rafes评审团组成:菲利普·普谢拉尔伊夫林地区凡尔赛-圣昆廷大学教授,因里亚大学校长塞德里克·杜穆扎巴黎Cnam HDR高级讲师-Cédric报告员丹·沃迪斯拉夫教授,U. Cergy-Pontoise-ETIS报告员哈立德·贝尔哈贾梅巴黎多菲纳大学高级讲师-LAMSADE考官安妮·杜塞特索邦大学教授-LIP 6考官莎拉·科恩-布拉基亚教授,U.南巴黎,美国。Paris-Saclay-LRI博士生导师Serge AbiteboulENS Paris Inria研究总监-论文联合总监博士学位论文NNT:来自CTORAT的THESE大学在Université P aris -南南大学准备大学中的链接数据Karima Rafes由Sarah Cohen-Boulakia监督教授巴黎-南巴黎-萨克雷大学-LRISerge AbiteboulENS Paris Inria研究总监2019年1月27日摘要巴黎萨克雷大学数据科学中心于2016年部署了一个与链接数据兼容的然而,研究人员在面对这些技术时遇到了许多困难。为了克服这些问题,在大学云(IAAS)上设计并测试了一种名为LinkedIn Wiki的方法和因此,我们能够为研究人员提供一种解决方案,用于发现、生成和重用链接开放数据中可用的研究数据,链接开放数据是 这一经验使我们能够证明,通过这种方法,在大学中使用链接数据是完全可能的。然而,一些问题仍然存在,例如(i)遵守链接数据协议和(ii)缺乏SPARQL. 我们为这两个问题提供了解决方案为了验证大学链接数据中是否符合此外,为了帮助研究人员查询链接开放数据,我们实现了ets-FinderSPARQL演示器,它可以在不了解链接开放数据中RDF模式的情况下,使用自动完成工具轻松设计SPARQL摘要巴黎萨克雷大学数据科学中心于2016年部署了一个由于研究人员在使用这些技术时面临着许多困难,因此在大学云(IAAS)上设计并测试了一种方法,然后是一个我们称之为LinkedIn Wiki的平台,以实现与链接数据兼容的模块化虚拟搜索环境(VRE)的我们能够为研究人员提供一种在链接的开放数据中发现、生成和重用可用研究数据以互联网规模出现的全球信息系统。这一经验使我们能够证明,通过这种方法,在大学内有效使用链接数据是完全然而,仍然存在一些问题,例如(i)遵守协议和(ii)缺乏用于查询SPARQL链接的开放数据的适当工具。我们为这两个问题提供解决方案。为了能够验证大学链接数据中SPARQL协议的合规性,我们创建了SPARQL评分指标,用于在SPARQL服务部署到大学信息系统之前评估其合规性此外,为了帮助研究人员查询链接的开放数据,我们实现了一个SPARQLets-Finder,这是一个演示器,它表明在不了解链接的开放数据中的RDF模式的情况下,使用自动完成工具促进SPARQL查询的设计是可能的谢谢你我感谢我的父母,我的兄弟姐妹,他们一直支持我成为一名我要感谢Jean Rohmer,他在我还要热烈感谢我的论文和我的共同导师Serge Abiteboul,他们与他们在一起的这段经历将深刻地影响我未来研究工作的方向。我要特别感谢巴黎南部分析化学药学院的高级讲师Sana Tfaili,她有勇气接受成为第一个对本论文中描述的方法进行端到端实验的人,以改善她的团队以及她所在大学的所有同事的当 然 , 我 也 要 感 谢 Julien Nauroy 、 Balazs Kegl 、 Michèle Sebag 、 MarcSchoenauer、Guillaume Philippon、Catherine Delplanque、Valérie Cantonny、Denis Humbert,以及所有支持或参与本论文所述实验的研究人员、工程师或研究技术人员,以及我的学生最后,我要感谢所有的互联网用户,比如维基人,他们通过自己的行动,帮助建立了一个为所有人服务的非商业性网络。 正是他们赋予了我的工作以意义,并给了我继续工作近十年的能量。我的论文材料表摘要我摘要iii.谢谢你V1引言11.1大学中的语义网... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...11.2在巴黎萨克雷大学的生态系统中... ... ... ... ... ... ... ... ... ... ... ...21.3目标。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...41.4捐款。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...42链接数据72.1引言。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...72.2历史。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...82.3良好做法。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...92.4研究的结构化和链接数据。... ... ... ... ... ... ... ... ... ... ... ...132.5制动器。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...... ... ...172.5.1在数据发现期间。... ... ... ... ... ... ... ... ... ... ... ... ... ... ...182.5.2数据生成期间。... ... ... ... ... ... ... ... ... ... ... ... ... ... ...192.5.3在数据重复使用期间。 . . . . . . . . . . . . . ... 202.6结论。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...22摘要。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...233LinkedIn Wiki:使用链接数据进行数据管理253.1引言。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...263.2采用的解决方案。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...273.2.1数据发现解决方案。... ... ... ... ... ... ... ... ... ... ... 273.2.2数据分析解决方案... ... ... ... ... ... ... ... ... ... ... ... ... 353.2.3数据重用的解决方案。... ... ... ... ... ... ... ... ... ... 393.3实施。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...443.3.1 LinkedIn维基平台。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...443.3.2将wiki转换为RDF知识库。... ... ... ... ... 483.3.3重复使用链接数据。 . . . . . . . . . . . ...493.4评估。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...503.4.1定量评价。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...503.4.2定性评价。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...53八3.5结论57摘要和已发表结果594SPARQLet-Finder:SPARQL61的代码片段自动完成4.1导言614.2实验的背景4.3L’algorithme4.3.1概览4.3.2BGP和距离测量的通用结构664.3.3BGPHC:BGP70的分层分类4.3.4建议片段的工作流744.3.5BGPHC78中关于课程的讨论4.4片段的相关性评估794.4.1定量评估804.4.2科学家的定性评估824.5结论84摘要和已发表结果855SPARQL得分:互操作性指标5.1导言875.2L’interopérabilité5.3我们的贡献905.3.1一种测试SPARQL90服务的方法5.3.2SPARQL 91服务互操作性指标5.3.3SPARQL91服务的最小API5.4评估互操作性的条件5.5功能965.6测试台的安装995.7实施1045.8评估1055.9结论106摘要和已发表结果1076结论109附件A SPARQL 111的自动完成类型参考书目115第一章引言巴黎萨克雷大学数据科学中心决定为研究人员提供一个与链接数据兼容的 我开发的软件在2016年部署了该平台的第一个版本后,我们通过这篇论文分析了研究人员在面对这些技术时遇到的问题然后,我们能够提出并测试一种全球方法,以促进研究人员在链接数据方面的工作这种方法被称为LinkedIn Wiki,它预示着语义网在大学中发挥作用所需的教育系统可能是什么1.1大学中的语义网随着Web的成功,语义Web的概念于2001年由W3C传播给科学界。第一个目标是17年后,对一些人来说,语义网必须围绕允许机器理解人类语言的技术来2006年,为了将语义网的这两种观点分开,人们将语义网数据命名为LinkedData,这些数据将被适当地结构化并链接在一起,以便机器有一天可以直接使用它们。不幸的是,这而在法语中,这种混乱甚至被链接开放数据的截断翻译放大了(每个人都可以访问的版本2第一章. 简介ked Data),成为数据的Web,而不是将其翻译为链接数据的Web为了避免在本文中出现这种混淆,我们将只使用术语链接数据来指代链接数据。由于这种持续的混乱和过去11年中可用的结构化数据很少,许多科学家得出结论,不可能自然地获得这种结构化数据的临界质量,而这种临界质量对于创建语义网所承诺的这些新系统是必不可少的,因此有必要优先考虑Web文档中所包含的意义的自动提取,这种方法这两种方法是互补的,尽管实现它们所需的技术非常不同。[94从社区(如大学)的角度来看第一个好处是通过链接数据技术更好地保存、传输和促进研究工作的可第二个好处是最后一个原因是,这些社区不再愿意为在网络上访问自己的知识付费[39],并将链接数据视为一个机会,可以摆脱本论文所涉及的工作是在1.2在巴黎-萨克雷大学的生态系统中虽然法国的大学在组织上非常相似巴黎-萨克雷大学的情况有其特殊性首先,它成立于2014年,旨在汇集法国许多最著名的机构,包括三所这些机构在巴黎萨克雷大学内联合起来,汇集了最高国际水平的 这种协同作用有多种形式。在数据科学领域,CDS(数据科学中心)的使命是在实验室之间提供桥梁,以促进产生和/或消费数据的本论文是我们与药学院的Lip(Sys)2实验室、法学院的法律和宗教协会实验室以及La-1.2. 在巴黎萨克雷大学的生态系统中IPSL研究所的大气、环境、空间观测实验室(LATMOS)此外,这个实验是在一所大学里进行的,这所大学的特点是分散的组织和共享其IT基础设施的愿望,这似乎是矛盾的。在现实中,我们将看到,所有这些差异和矛盾都是评估链接数据新技术的资产。异构信息系统。L’un des problèmes souvent rencontrés par要回答他们:— 研究人员往往只能靠自己了。— 获得资助的研究人员可以聘请一名或多名计算机科学家来完成部分工作。他们很少有能力支付一个可持续的信息系统— 一些实验室在更重的设施上工作,以处理其领域内的研究数据,但这种情况很少发生。在这种情况下,数据科学中心的使命是与那些仍在努力处理数据的实验室和研究人员分享他们去中心化的生态系统,否则什么都没有。大学里的每一个机构都希望在他们的研究和进行研究的方式上保持自由。这意味着不可能实施严格的这个治理问题并不新鲜,但网络参与者已经能够通过发明一种以去中心化方式共享文档的方法来解决这个问题,从而让参与者可以自由地以他们想要的方式分发或不分发然而,它花了大约20年的时间来实现。 目前,还没有真正的去中心化解决方案来管理研究数据。最接近的解决方案是链接数据,它将作为语义Web软件的信息系统。不幸的是,这种用于管理、查询和跟踪海量数据的分散式全球信息系统并不完全可用。目前,每个机构都在实施自己的解决方案来管理其数据,同时意识到这些解决方案是临时的,需要融合以促进其研究工作。基础设施的相互作用。L’évolution technologique vers le calcul à haute 作为南巴黎大学旨在更好地构建科学信息学的行动的一部分它使用了先进的虚拟数据基础设施,该基础设施可在奥赛校区获得,并由线性加速器实验室(CNRS的LALIN2P3)开发,该实验室是计算时间的主要消耗者,特别是实施了云和服务。4第一章. 简介相关的。RAL将其在IT开发方面的专业知识提供给通过总结这所新大学的特点,我们得到了一个明确的去中心化生态系统,其中有成千上万的数据消费者和生产者,有可能建立一个未来的共享信息系统。因此,巴黎萨克雷大学汇集了所有必要的要素,以试验实施真正的科学数据管理解决方案,从而促进研究人员的工作为了将所有这些要素联系起来,1.3目标我们的目标如下:— 实施与链接数据兼容的数据共享平台,以促进大学内数据的重用,从而鼓励数据生产者和消费者之间的协同作用。— 通过大学为研究人员提供的云基础设施和计算网格,促进大量实验室数据的重用,1.4贡献在第2章介绍了链接数据的最新技术水平和我们遇到的研究人员的实践之后,我们的贡献在三章中进行了— 第3章介绍— 第四章讨论了大学内部链接数据的查询问题。我们的解决方案提供了一种基于分层聚类算法的SPARQL请求自动填充机制。— 第5章讨论了在链接数据中遵守SPARQL服务互操作性的问题。 我们引入了一个互操作性级别的指 标 , 该 指 标 是 通 过 一 系 列 50 0 多 个 自 动 化 测 试 计 算出 来 的 , 以 及 一 种 调 整 信 息 系 统 中 部 署 的 S P A R Q L 服 务 的 协 议的 方 法 。第六章结束了这项工作。1.4. 贡献5本文发表的结果发表的文章:使用代码片段自动完成设计科学SPARQL查询». Karima Rafes、Serge Abiteboul、Sarah Cohen-Boulakia和Bastien Rance。参见:eScience,2018年IEEE第14届IEEE国际会议。2018年。[120]"认证RDF数据库系统的互操作性"。Karima Rafes、Julien Nauroy和Cécile Germain。LDQ 2015-第二届链接数据质量研讨会。2.斯普林格。2015年。已发布的演示:[118] "SPARQL在多服务上下文中的通用自动完成",Karima Rafes、SarahCohen-Boulakia和Serge Abiteboul。在BDA中。2017年。[119] "科学数据共享平台"。Karima Rafes和Cécile Ger- Main。在:BDA(高级数据库)。2015年。[121]TFT , 三 重 存 储 测 试 。 Karima Rafes 、 Julien Nauroy 和 CécileGermain。语义网挑战赛,国际语义网会议的一部分2014年。其他作品[96]欧洲研究项目提案(H2020):支持开放科学:研究维基数据。».Daniel Mietchen、Gregor Hagedorn、Ka-rima Rafes等人。2015年。[140]海报:分析平台的数据采集:自动化科学工作流程并为化学分析元数据构建开放数据库平台。Sana Tfaili、Diem Bui Thi、Karima Rafes等人。在Chemiometri-xvii.海报。2016年。研讨会:[56]使用第三方分类法将维基百科转变为面向本地专家的基于本体的信息格雷戈里·格雷芬斯特特和卡里玛·雷夫斯。LO2TKS语言和本体2016年。网格观测站3.0使用语义技术实现可重复研究和开放合作。».塞西尔·热尔曼、朱利安·瑙罗伊和卡里玛·雷夫斯。2014年EGI社区论坛2015年5月
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功