没有合适的资源?快使用搜索试试~ 我知道了~
基于本体论的定制数据管理系统的生成
基于本体论的定制数据管理系统的生成:在实验粒子物理学中Blerina Gkotse引用此版本:Blerina Gkotse。基于本体论的定制数据管理系统的生成:在实验粒子物理学中的应用运筹学[cs.RO]。巴黎科学与文学大学,2020年。英语。NNT:2020UPSLM017。电话:02987043v2HAL ID:电话:02987043https://hal.science/tel-02987043v2提交日期:2020年HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire在Mines ParisTech基于本体论的定制数据管理系统的生成:在实验粒子物理学中基于本体的个性化数据管理系统生成:在实验粒子物理学中的支持者Blerina Gkotse2020年9月25日第621号研究生院系统工程专业性实时计算、机器人和自动化评审团组成:劳伦特·迪索教授,蒙彼利埃大学Laura Gonella伯明翰大学高级讲师Jean-Baptiste LAMY巴黎第13西奥多拉·瓦拉里古教授,雅典国立工业大学费德里科·拉沃蒂CERN博士Pierre Jouvelot,巴黎矿业技术公司研究总监评审团主席报告员报告员检查员检查员论文指导确认书本博士根据资助协议编号,论文获得了欧盟地平线2020研究和创新计划的资助。654168.我首先要感谢我在巴黎矿业技术大学的论文主任Pierre Jouvelot和我在欧洲核子研究中心的导师Federico Ravotti,感谢他们多年来的支持和指导。他们的帮助和建议对这篇论文的工作是无价的,并使我了解了研究的本质和它是如何执行的。我想感谢Laura Gonella和Jean-Baptiste Lamy审阅了这份手稿,并为我提供了宝贵的输入。更重要的是,我感谢Theodora Varvarigou和Laurent Dusseau参加我的论文评审团。此外,我要感谢巴黎矿业技术公司的CRI团队,特别是Francois Irigoin、Jérôme Adnot、Olivier Hermant和Bruno Sguerra。我还要感谢欧洲核子研究我也非常感谢能成为CERN IRRAD团队的一员,并与伟大的同事一起工作。更具体地说,我想感谢莫里斯我还要感谢Georgi、Isidre、Rania、Viktoria、Jes、Emanuele和Martin对我工作的反馈更重要的是,我想感谢学生卡塔琳娜,科努尔,亚历山大,阿尔弗雷多,萨宾娜,马格努斯和何塞谁是工作或与我一起工作特别感谢Dorota,感谢她这些年来对我们的支持。除了我的IRRAD家庭,我还要感谢我真正的家庭,我的父母,他们为我提供了适当的教育,推动我前进,并一直相信我。特别感谢我在希腊最好的朋友, Eleni,Giorgos,Angela,Foteini,Katerina和Efthymis。还有我在日内瓦的好朋友马科斯、约翰、莫里茨、露西娅、克拉拉和尼古拉。最后但并非最不重要的是,我想表达我对格里戈里斯多年来鼓励我和相信我的感激之情。内容。确认I1引言11.1目标。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...21.2捐款。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...31.3计划。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...31.4出版物清单。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...41.5目标。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...61.6论文投稿。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 71.7大纲。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 81.8已发表作品。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...92背景102.1网络语义学112.1.1定义112.1.2本体语言152.1.3本体的类型162.1.4本体开发和可视化工具172.2辐射实验172.2.1辐照设施和在线数据库192.2.2实验粒子物理学(EPP)212.2.3欧洲核子研究中心和质子辐射设施(IRRAD)3相关工作26内容。3.1EPP27中的数据管理系统3.1.1数字用户办公室(DUO)283.1.2监控和可视化工具293.1.3报告工具31ii.3.2EPP33中的域本体3.3基于本体的数据管理系统343.4UI定制和个性化353.4.1用户体验研究结果373.4.2用户界面自定义413.4.3建议型号424使用GenAppi44生成数据管理系统4.1基于本体的Web应用程序生成本体(OWAO)4.2数据管理Web应用程序生成(GenAppi)474.2.1算法和工作流474.2.2讨论504.3UI定制和个性化514.3.1第51代建议4.3.2受欢迎程度模型534.3.3ontowalk2vec,一个新的本体嵌入模型544.4摘要595GenAppi在EPP数据管理中5.1IRRAD数据管理器(IDM)615.1.1设计生命周期615.1.2发展625.1.3建筑645.1.4部署655.1.5功能665.2辐射实验数据管理本体(MEI)695.2.1导入的本体705.2.2设计方法论715.2.3核心结构735.2.4FCC-Radmon,辐射实验77的一个用例内容。5.3GenAppi生成的基于IEDM的数据管理的比较水泥系统和IDM785.3.1IEDM专用数据管理系统785.3.2与IDM80的比较5.4使用其他本体进行835.5摘要846使用ontowalk2vec85进行UI个性化设置6.1技术分类和评估指标866.2ontowalk2vec的算法和分类906.3MUTAG本体实验916.3.1实验设置926.3.2结果926.4使用Ontowalk2vec和OWAO986.4.1实验设置986.4.2实验1:偏好1006.4.3实验2:人气1026.4.4非零数据集1046.4.5OWAO嵌入式106的余弦相似性6.5优化1076.5.1实验设置1086.5.2评估指标和结果1106.6摘要1137结论1147.1捐款1147.2前景1167.3第117章7.4论文贡献1187.5前景1197.6第120章参考书目122词汇表137内容。首字母缩略词138C.有v辐射设施数据库和网站A-1A.1功能...............................................................................................................A-1A.2数据库内容... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... A-2B 测试光束设施数据库和网站B-1B.1功能。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... B-1B.2数据库内容。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... B-1C IRRAD数据管理器(IDM)C-1安装图列表2.12000年的W3C语义Web堆栈或层蛋糕,摘自Fabien Gandon的"语义Web和链接数据研究前20年的调查"[Gan18](名称解释见术语表和首字母缩略词部分)。................................................................122.22018年语义网堆栈的新版本,来自FabienGandon"语义网和链接数据研究前20年的调查"[Gan18](名称在词汇表中解释)和首字母缩略词部分)。............................................................................132.3来自Google知识图的 摘 录 显 示 了 与 一些艺术家 相 关 的 信 息(例如,米开朗琪罗和他的联系在他们中间。...............................................................................................142.4摘录自SOSA(传感器、观测、样品和实际值)tors)包含一些实例的本体......................................................................... 152.5葡萄酒本体通过Protégé平台进行说明。在左侧部分,本体类显示(黄点),同时显示各个实例及其属性和注释它显示在界面的其余部分。.......................................................................182.6通过电子束辐照对瓶子进行灭菌。...........................................................192.7在线辐照设施数据库平台包含全球辐照设施的数据条目。...................202.8欧洲核子研究中心加速器综合体(Mob16)。...................................... 232.9IRRAD设施辐射区。..................................................................................243.1SOLARIS数字用户办公室(DUO)[SLR]。.......................................... 283.2Jefferson实验室用于控制显示系统的Web可扩展显示管理器(来自R.J. 斯洛明斯基和T.拉里。Web可扩展显示管理器2 [SL19]。.....................................................................303.3默认Tornado DS索引页(来自M. Broseta等人,通过WebSockets为Tango控制系统提供的基于Web的报告工具[BRB +17])。..................32六图列表vii3.4DetectorFinalState PDO的示意图(摘自DavidCarral等人,"粒子物理分析的本体设计模式"[CCDT +15])。.................................................... 333.5美国许多医院使用的Epic图表软件的屏幕截图黑箭头显示警报显示的位置(来自C.萨瓦德S. Jonathan Shariat,《悲剧性设计:糟糕产品设计的影响以及如何修复》(SS17)。.......................................................................... 363.6对比表(来自Jeremy Girard,"如何在网页设计中对比背景和前向颜色,2019"[Gir19])。.................................................................................393.7古腾堡图(摘自史蒂文·布拉德利,《设计基础》[Bra18])。.............403.8F模式(摘自Steven Bradley,《设计基础》[Bra18])......................... 403.9Z模式(摘自Steven Bradley,《设计基础》[Bra18]).........................403.10 尼尔森诺曼集团的F阅读模式眼动跟踪[PWNG14]。四十一4.1OWAO示例(浅蓝色:域本体相关实体,黄色:模型相关实体,绿色:Web应用程序相关实体,深蓝色:操作相关实体,橙色:UI小部件相关实体); .............................................................................................454.2GenAppi生成器工作流。.................................................................................484.3OWAO部分用于描述UI首选项。.............................................................524.4推荐型号。向用户显示特定UI的不同UI样式并选择他/她的偏好,这将作为反馈提供给OWAO。......................................................................... 544.5Word2with架构。 CBOW体系结构根据上下文预测当前单词;跳过语法模式根据上下文预测当前单词。给出当前单词[MCCD13]。....................................................................... 564.6从节点u开始,面包优先搜索(BFS)遍历以红色箭头表示,而深度优先搜索(DFS)路径以蓝色箭头表示允许(来自A. Grover和J.Leskovec,"node2vec:网络的可扩展特征学习"(GL16)。..........564.7基于超参数p和q的node2随机行走生成。从t到v的遍历过渡,并评估其离开节点v的下一个可能步骤(从A到V)。 格罗弗和J. 莱斯科韦茨,node2vec:网络的可扩展特性学习。......................................................57图列表viii4.8使用ontowalk2vec 嵌入 工作流 OWAO本体 用作 node2vec和RDF2Vec的输入,其中提取node2vec随机行走和RDF三元组,并用作word2vec跳过语法的输入句子。然后可以将向量用于推荐系统。...............................................................585.1Balsamiq原型。.......................................................................................... 635.2IDM体系结构。.......................................................................................... 655.3IDM功能。.................................................................................................. 665.4MEI在线文档。...........................................................................................725.5受 保 护 的 MEI 本 体 中 的 图 形 表 示 , 重 点 是 iedm :IrradiationExperiment类。左列显示MEI的类别,右列显示MEI的类别。对象属性。...................................................................................................765.6IEDM专用应用程序的登录页面。............................................................795.7在IEDM专用应用程序中注册新样本795.8生成的应用程序中MEI的WebVOWL可视化页面。.............................. 805.9"创建用户实例"形式的IDM,位于顶部;生成的Web应用程序版本,位于底部。...................................................................................................... 815.10 在顶部列出IDM的用户界面,生成的Web应用程序在底部。.......................................................................................................825.11 使用MarineTLO作为输入本体的生成Web应用程序的类BT33_Marine_Animal_Type的列表视图6.1使用t-SNE进行MNIST分类(来自L.范德马滕和G. Hinton,"使用t-SNE可视化数据"(MH 08)。................................................................. 886.2余弦相似性896.3摘自MUTAG描述化合物实例(d30)。936.4不同方法的准确度图。...............................................................................946.5node 2 vec t-SNE致突变和非致突变元素的可视化。............................ 966.6RDF 2 Vec t-SNE致突变和非致突变元素可视化。.................................966.7ontowalk 2 vec t-SNE致突变性和非致突变性元素分类。.................... 97图列表ix6.8描述用户实例(User1)及其的OWAO摘录B.2超级质子同步加速器(SPS)测试光束设施数据的屏幕截图。..........B-3B.3SPS的T9光束线输入数据的屏幕截图。 ... ... B-4给定UI组件的首选项。 . . . . . . . . . . . . . . ...996.9OWAO首选项的t-SNE可视化。 ... ... ... ... ... ... ... ... ... ... ... ...1026.10t-SNE可视化以提高OWAO的知名度。 ... ... ... ... ... ... ... ... ... ... ... ... ...1046.11不带0值的OWAO流行度的t-SNE可视化。... . ...1066.12BFSF1直方图评分。 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...1126.13WLF1直方图评分。 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...112A.1向用户提供辐照设施的详细信息截图。... ...A-3表列表5.1GenAppi生成的MEDM应用程序与IDM的比较。 826.1二进制分类的混淆矩阵。...........................................................................876.2使用MUTAG数据集的模型准确度评分。................................................946.3MUTAG本体95的模型6.4为ontowalk2vec设置背景和颜色首选项。............................................1006.5字体大小首选项。.....................................................................................1006.6文本对齐首选项。.....................................................................................1006.7OWAO首选项的准确性。....................................................................... 1016.8OWAO偏好的混淆矩阵。....................................................................... 1016.9人气值阈值。............................................................................................. 1026.10 OWAO受欢迎程度的准确性1036.11 OWAO受欢迎程度的混淆矩阵1036.12 具有非零流行度值的OWAO流行度的准确性。1056.13 没有0值的OWAO流行度混淆矩阵。.......................................................1056.14 owao:User251使用BFS107的前5个最高余弦相似性6.15 owao的前5个最高余弦相似性:使用WL的User251。.........................1076.16 与owao的相似性比较实例:white_black_medium_left1096.17 与owao相似性比较的实例1106.18 超参数及其范围,用于形成组合6.19 BFS的F1得分最高(>0.9)................................................................... 1126.20 WL的F1得分最高(>0.9)................................................................... 1126.21 owao的最大cosine相似性使用BFS113xC型HAPTER1简介法文版如今,科学和技术领域的进步越来越大。例如,在物理学领域,为了深入探索物质和宇宙,已经建造了大型物理实验设施,这些努力导致产生了大量需要跟踪、处理和分析的异构数据。与此同时,在计算领域,许多技术进步对生活的各个方面都产生了广泛的影响。计算机、智能手机和软件应用程序支持、促进或加速重要的日常生活任务。尽管在所有科学领域都取得了重大进展,但弥合上述不同领域和子领域之间的差距仍然具有挑战性,因为在一个特定领域获得的知识并不总是转移到其他领域,往往导致它们之间缺乏交流和思想的交叉交流。这导致了大量信息和专门知识的损失,而这些信息和专门知识本可以用于进一步发展某一科学领域。这种情况需要更多的跨学科研究,这是本论文工作的关键,它借鉴了高级软件应用程序通常是相当复杂的系统,需要大量的开发和测试时间来开发和测试。开发人员,以及需要学习如何使用这样的系统的用户的特殊培训,这导致大量的时间和劳动力成本。因此,为了在11. I内导管2开发并使软件系统更加直观和用户友好,以便1.1目标在实验粒子物理学(EPP)领域,每天都有大量的实验来发现新的物理现象,同时为物理世界中存在的东西提供越来越精确的解释。 A因此,管理和分析来自此类实验的异质数据对于所进行实验的准确性和可重复性至关重要。然而,数据的保存、整合和相互交流问题本论文的目的是利用语义网技术来PPE领域数据管理的标准化。众所周知,语义网技术促进了一个这样的工具是本体的概念,它是一个特定于给定应用领域的声明性知识结构(并在后面的章节中更详细地解释)。因此,本文的主要目标如下。这项工作的第一个目标是,在与本体论的概念,提供特定于特定类型的EPP实验的某些数据管理概念的公理化,这就是"辐射实验"。这一努力最终形成了本论文工作的第二个目标是从这个本体中自动化开发专用数据管理系统的过程(通过Web应用程序)。由此产生的基于EPP本体的应用程序可以被认为是一个用例使用本体来自动生成数据管理系统的更一般的最后,本文的第三个目标是提高用户友好性。这些数据管理系统通过引入自定义用户界面(UI)的方法来···1. I内导管31.2贡献为了辐射实验数据管理本体(IEDM)辐射实验数据管理本体(GenAppi是一种新的基于本体的方法,用于生成用于EPP领域数据管理的Web应用程序。它使用MEI作为Web应用程序生成的用例ontowalk2vec这种新方法是通过集成几种先进的自然语言处理(NLP)技术而开发的除了这三个基本的贡献,更多的实际发展也归因于这篇论文的工作IDM(IRRAD数据管理器)此专用Web应用程序目前在CERN质子辐照中心(IRRAD)[ CER ] [ GGMR15 ]中每天使用她启发了MEI和GenAppi的开发用于探测器鉴定的辐照设施和光束的数据库和网站在对世界各地辐照设施进行的辐照实验进行分析的研究之后,开发了两个单独的网站和数据库,这两个网站和数据库分别是用于进行辐照实验的专用EPP基础设施和用于鉴定EPP实验中使用的探测器的光束基础设施。它们包含在这些研究过程中积累的数据1.3计划这一第2章提供了网络语义学、EPP和辐射实验的必要基础,以充分受益于阅读这篇论文手稿。请有经验的读者浏览这些页面。1. I内导管4第三章详细介绍了EPP软件系统、与EPP相关的本体、从本体生成用户界面、用户体验的概念以及用于用户界面定制的推荐系统等领域的相关工作第4章介绍了GenAppi方法,该方法是为生成数据管理Web应用程序而开发的。此外,还引入了一个新的本体,用于基于本体的Web应用程序(OWAO),用作GenAppi方法的支持层。本章中描述的另一个新概念是ontowalk2vec,这是一种用于为推荐系统生成本体表示向量("嵌入")的算法(然后有一整章专门讨论这种新技术)。第5章详细描述了前面介绍的方法的一些应用。首先,介绍IDM Web应用程序。然后在本章的最后一部分,第 6 章 的 重 点 是 将 ontowalk 2 vec 与 当 前 用 于 提 供 本 体 嵌 入 ( em-beddings)的最先进的NLP方法进行比较。然后使用OWAO本体数据测试我们的方法,并评估其是否可用于根据用户偏好和用户界面相似性重新订购自定义用户界面功能。最后,第7章介绍了本论文的结论,并讨论了未来可能的展望。1.4出版物清单本论文的部分工作与以下出版物有关B. Gkotse,P. Jouvelot,和F. Ravotti,查姆:施普林格国际出版社,波托罗兹,斯洛文尼亚,2019年,第80B. Gkotse , P. Jouvelot , 和 F. Ravotti , " 从 辐 射 实 验 数 据 管 理 本 体(MEI)自动生成Web应用程序",在第17届加速器和大型实验物理控制系 统 国 际 会 议 上 , ICALEPCS 2019 , 2019. [ 在 线 ] 。 可 从http://icalepcs2019.vrws.de/papers/tubpl01.pdf获得[GJR 19 a];··1. I内导管5B. Gkotse,P. Jouvelot,G. Pezzullo和F. Ravotti,B. Gkotse 先 生 。 格 拉 泽 , P. Jouvelot , E. 马 特 利 , G. Pezzullo 和 F.Ravotti,迈向1B. Gkotse先生。布鲁格,p。卡本,S。丹泽卡,A.法比希,R.G. 阿利亚,M. 格拉泽,G.Gorine先生R. Jaekel,我。M. 苏,G.Pezzullo,F.波齐,F.拉沃蒂先生。Silari和M. Tali,1B. Gkotse和G. Gorine,"IRRAD样本用户管理系统和在线数据库固定规范 " , AIDA-2020-MS 16 , CERN , 2016 。 [ 在 线 ] 。 可 在https://cds.cern.ch/record/2159521 [GG 16]上查阅;除了这些出版物,第6章的一篇文章····1. I内导管6英文版今天,科学和技术领域的进步越来越大。例如,在物理学领域,已经建立了托管物理学实验的大型基础设施,以深入探索物质和宇宙,为一些开放性问题提供答案[E+ 19],同时让其他问题得到解决。这些努力产生了大量需要监测、处理和分析的异质数据。然而,在计算机科学领域,许多技术进步对生活的各个方面都产生了广泛的计算机、智能手机和软件应用程序支持、促进或加速重要的生活任务尽管在每一个科学领域都取得了重大进展,但由于在一个特定领域获得的知识并不总是转移到其他领域,往往导致它们之间缺乏交流和思想的交叉交流,因此仍然很难弥合上面提到的各个领域和子领域之间的差距。这导致了本可用于科学领域进一步发展的重要培训和知识的这需要更多的跨学科研究,这是目前工作的关键,建立在计算机科学、面向用户的界面设计和实验物理学中软件开发的想法之上。高级软件应用程序通常是相当复杂的系统,需要开发人员大量的开发和测试时间,但也需要对需要学习如何操作此类系统的用户进行特殊培训,从而导致大量的时间和人力成本。因此,为了在科学领域,特别是在专家心理物理学中实现更好和更快的软件集成,有必要最大限度地减少开发时间,并使软件系统更加直观和用户友好,以便它们能够更容易地被其预期目标人群采用。1.5目标在实验粒子物理学(EPP)领域,每天都要进行各种各样的实验,以发现新的物理现象,同时也证明了对物理世界中存在的东西的更准确的解释。为此,对此类实验产生的异质数据的管理和分析对于所进行实验的准确性和再现性至关重要。然而,由于前面几段提到的原因,数据保存、集成和内部通信没有得到应有的重视。本文旨在为EPP领域的数据管理标准化构建基于Web的语义技术Web语义技术
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++多态实现机制详解:虚函数与早期绑定
- Java多线程与异常处理详解
- 校园导游系统:无向图实现最短路径探索
- SQL2005彻底删除指南:避免重装失败
- GTD时间管理法:提升效率与组织生活的关键
- Python进制转换全攻略:从10进制到16进制
- 商丘物流业区位优势探究:发展战略与机遇
- C语言实训:简单计算器程序设计
- Oracle SQL命令大全:用户管理、权限操作与查询
- Struts2配置详解与示例
- C#编程规范与最佳实践
- C语言面试常见问题解析
- 超声波测距技术详解:电路与程序设计
- 反激开关电源设计:UC3844与TL431优化稳压
- Cisco路由器配置全攻略
- SQLServer 2005 CTE递归教程:创建员工层级结构
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功