链接警告:这份文件是长期工作的结果,得到了答辩小组的批准,并提供给整个更广泛的大学社区。它受作者知识产权的约束:这意味着在使用本文档时有义务引用和引用。另一方面,任何伪造、剽窃、非法复制本作品的行为都将受到刑事起诉。联系方式:portail-publi@ut-capitole.fr知识产权法-第L条。122 -4和L. 335 -1至L。335-101992年7月1日第92-597号法律,1992年7月2日《政府公报》公布http://www.cfcopies.com/V2/leg/leg-droi.phphttp://www.culture.gouv.fr/culture/infos-pratiques/droits/protection.htm论文为了图卢兹大学博士学位由图卢兹第一大学提供提交和支持者拉巴·蒂吉尔特·费哈特2021年11月16日基于模型驱动方法从面向文档的NoSQL数据库中提取模型博士学校:EDMITT-图卢兹数学、信息学和电信博士学校专业:计算机科学与电信研究单位:IRIT:图卢兹计算机研究所论文指导人吉勒·祖弗卢陪审团ElisabethMETAIS女士,报告员M. SlimaneHAMMOUDI,报告员FatenATIGUI女士,审查员M. 杰罗姆·达蒙特,审查员FatmaAbdelhedi女士,审查员M. GillesZURFLUH,论文主任论文为了图卢兹大学博士学位由图卢兹第一大学提供提交和支持者拉巴·蒂吉尔特·费哈特2021年11月16日基于模型驱动方法从面向文档的NoSQL数据库中提取模型博士学校:EDMITT-图卢兹数学、信息学和电信博士学校专业:计算机科学与电信研究单位:IRIT:图卢兹计算机研究所论文指导人吉勒·祖弗卢陪审团ElisabethMETAIS女士,报告员M. SlimaneHAMMOUDI,报告员FatenATIGUI女士,审查员M. 杰罗姆·达蒙特,审查员FatmaAbdelhedi女士,审查员M. GillesZURFLUH,论文主任博士学位论文211拉巴·蒂吉尔特·费哈特摘要博士学位论文45拉巴·蒂吉尔特·费哈特我们的工作是在NoSQL DBMS管理的数据库的背景下进行的。这些系统中的大多数都是无模式的,这意味着在创建BD时不提供数据模型。这种模型的缺失带来了理解数据语义的困难,以及缺乏对NoSQL BD组织的可见性。也就是说,数据模型的缺失不允许用户知道数据是如何存储的(以什么名称和类型)以及如何在BD中链接。然而,这种知识对于表达请求是必不可少的。 基于模型驱动工程,我们提出了两种-描述数据的内部组织并允许表达查询的物理模型。-抽象技术方面并专注于数据语义的概念模型。这两个模型是通过元建模和自动转换技术从NoSQL BD中连续提取的。博士学位论文67拉巴·蒂吉尔特·费哈特摘要博士学位论文89拉巴·蒂吉尔特·费哈特我们的工作在NoSQL DBMS管理的数据库环境中进行。其中大多数是无模式的,这意味着在创建数据库时不提供数据模型。这种数据模型的缺失导致了对NoSQL数据库中数据组织的理解和可见性的缺乏。换句话说,数据模型的缺失不允许用户知道数据是如何存储(在什么名称和什么类型下)和链接到数据库的。但是,这些知识对于快速请求至关重要。本文的目的是提出一种方法来提取处理无模式NoSQL数据库所需的物理和概念模型。基于模型驱动工程,我们提出了两种模型的开发:-描述数据的内部组织并使其能够表达查询的物理模型-不考虑技术方面并关注数据语义学的概念模型。这两个模型是通过元建模和自动转换技术从NoSQL数据库中连续提取的。博士学位论文1011拉巴·蒂吉尔特·费哈特谢谢你我非常真诚地感谢:感谢图卢兹卡皮托大学教授Gilles ZURFLUH先生指导我的工作,感谢他对我的完全可用性,感谢他给我的帮助、鼓励、批评和宝贵的建议我还要感谢他对我的信任,感谢他给了我很大的行动自由,感谢他为我的研究工作提供了极好的感谢里昂卢米埃尔大学教授Jérôme DARMONT先生同意评判我的作品,感谢他的评论,感谢他作为评审团主席给我带来的荣誉Elisabeth METAIS女士,巴黎国家艺术与工业学院(CNAM)教授,接受担任我论文的报告员。我谨向他表示最深切的感谢,感谢他仔细阅读了这份简报,Slimane HAMMOUDI先生,昂热ESEO教授,同意担任本论文的报告员,感谢他的评论和建设性的批评,使我能够大大提高手稿的质量,并感谢他参与我的评审团。我特别要感谢他与我们的讨论和他的许多建议。Fatma ABDELHEDI女士,TRIMANE CBI 2实验室主任,她参与了我的工作,并为Faten ATIGUI女士,巴黎国家艺术与工业学院(CNAM)讲师,感谢Amal AIT BRAHIM女士,NEXESS大数据分析AI研究和创新经理J’ai unereconnaissance博士学位论文12尽管他的职业承诺我还要感谢他对我的慷慨、鼓励、高质量的建议,以及从我的论文开始以来对我们研究的所有建设性交流。我很高兴认识了他。感谢计算机科学学院的经理与我合作教授课程的同事们,我能够与他们讨论教育我特别要感谢Geneviève Pujolle女士和Khalid TAZI先生。最后,我要感谢我所有的家人,他们在我非常感谢他们我的感激之情永远比不上他们的帮助和爱,他们在我需要帮助的时候给了我支持13拉巴·蒂吉尔特·费哈特材料表第1章第一次见面1.1 背景241.2 问题251.3 捐款261.4 论文的组织28第2章:技术背景和案例研究2.1 大数据:"大数据"322.2 NoSQL 332.2.1 面向关键值的模型342.2.2 定向模型35列2.2.3 定向模型-图形362.2.4 以模型为导向-文档362.3 模型驱动工程(IDM)382.3.1 一般原则392.3.2 以模型为主导的体系结构412.4 案例第3章:最新技术水平3.1 提取数据的物理模型463.1.1 工业解决方案463.1.2 研究工作473.2 概念数据模型的提取483.3 合成503.4 我们的工作定位52第4章:从面向NoSQL的BD中提取数据的物理模型4.1 我们的流程57博士学位论文144.2 子过程"冷"624.2.1 来源:PSM-BD634.2.2 目标704.2.2.1 PSM-MPD704.2.2.2 PSM-MetaData734.2.3 转换规则764.3 热子过程804.3.1 来源814.3.1.1 PSM-MPD814.3.1.2 PSM-MetaData814.3.1.3 PSM-Query814.3.2 目标854.3.3 转换规则854.3.3.1 请求添加的情况4.3.3.2 删除请求的情况4.3.3.3 请求修正案的情况4.4 物理模型提取过程的总结4.4.1 合成924.4.2 位置93第5章:将物理数据模型转换为概念数据5.1 我们的流程965.2 来源:PSM-MPD995.3 目标:PIM-MDC995.4 转换规则1055.5 概念模型提取过程综述5.5.1 合成1145.5.2 位置114第6章:实验和验证1176.1 实施工具6.1.1 第119章15拉巴·蒂吉尔特·费哈特6.1.2 XMI1206.1.3 QVT1216.2 原型122的描述6.2.1 ToPhysicalMode L123模块6.2.1.1 子模块模型提取1246.2.1.2 子模块ModelUpdate1306.2.2 概念模型1356.3 验证1406.4 结论144第七章:一般结论1477.1 我们的工作总结1487.2 观点150参考书目151博士学位论文16