没有合适的资源?快使用搜索试试~ 我知道了~
HAL Id: tel-00481049https://theses.hal.science/tel-00481049Submitted on 5 May 2010W. Amenel VoglozinTo cite this version:0HAL is a multi-disciplinary open access archivefor the deposit and dissemination of scientificresearch documents, whether they are publishedor not. The documents may come from teachingand research institutions in France or abroad, orfrom public or private research centers.0The multidisciplinary open archive HAL isintended for the deposit and dissemination ofscientific research documents, whether they arepublished or not, from French or foreign teachingand research institutions, public or privatelaboratories.0Linguistic summary of structured data as a support forquerying0W. Amenel Voglozin. Linguistic summary of structured data as a support for querying.Human-Computer Interface [cs.HC]. University of Nantes, 2007. French. NNT: . tel-00481049W. Amenel Abraham VOGLOZIN0Year 20070Centrale Nantes School University of Nantes Mines Nantes School0STIM DOCTORAL SCHOOL0"SCIENCES AND TECHNOLOGIES OF INFORMATION AND MATERIALS"0No assigned by the library01 2 3 4 5 6 7 8 9 00Linguistic summary of structureddata as a support for querying0DOCTORAL THESIS0Discipline: INFORMATICS0Specialty: INFORMATICS0Presented and publiclydefended by0On July 11, 2007, at the UFR Sciences & Techniques, University ofNantes, before the following jury0President: Pr. Mokrane BOUZEGHOUB PRiSM, University of Versailles0Reviewers: Daniel ROCACHER, H.D.R IRISA, University of Rennes 10Florence SÈDES, Pr. IRIT, Paul Sabatier University0Examiners: Guillaume RASCHIA, M.C. LINA, University of Nantes0Laurent UGHETTO, M.C. IRISA, University of Rennes 20Thesis supervisor: Pr. Noureddine MOUADDIB0Laboratory: LABORATOIRE D'INFORMATIQUE DE NANTES ATLANTIQUE.0CNRS FRE 2729. 2, rue de la Houssinière, BP 92208 - 44322 Nantes, CEDEX 3. No ED 0366-311favet neptunus euntiLinguistic summaries of structured data as a tool forqueryingW. Amenel Abraham VOGLOZIN▷◁0LINGUISTIC SUMMARY OF DATA0STRUCTURED DATA AS A SUPPORT FOR0QUERYING0University of NantesrogationIV+X+178 p.0W. Amenel Abraham V OGLOZIN Linguistic summary of structured dataas a support for0This document was prepared with LATEX2e and the these-LINA class version v. 2.7 of the youngresearchers' association in computer science LOGIN, University of Nantes. The these-LINA class is availableat: http://login.irin.sciences.univ-nantes.fr/. This class complies with the recommendations of the Ministryof National Education, Higher Education and Research (Circular No. 05-094 of March 29, 2005), theUniversity of Nantes, the doctoral school "Sciences and Technologies of Information and Materials"(ED-STIM), and complies with the following standards of the French Standardization Association (AFNOR):0- AFNOR NF Z41-006 (October 1983) Presentationof theses and related documents;0- AFNOR NF Z44-005 (December 1987) Documentation - Bibliographicreferences - Content, form and structure;0- AFNOR NF Z44-005-2/ ISO NF 690-2 (February 1998) Information and documentation - Bibliographicreferences - Part 2: Electronic documents, complete documents or parts of documents.0Printing: These.tex - 23/09/2007 - 14:34.0Revision for class: these-LINA.cls,v 2.7 2006/09/12 17:18:53 mancheron ExpAbstract0Summary0本论文介绍了在查询过程中使用数据摘要的方法...0In the context of the linguistic summaries of the SaintEtiQ model, this thesis focuses on...0本论文的重点是摘要是对关系表内容的描述。通过...0By defining linguistic variables, it is possible to use language terms to...0对表中的结构化数据进行特征化。此外,将摘要组织成层次结构...0The organization of summaries into a hierarchy offers various levels of granularity. We aim to provide...0对已构建的摘要进行具体化的方法。一方面,我们研究了使用...0The goal is to fully describe the data based on a partial characterization. We propose...0其中一些特征已知的数据。我们提出了一种重新...0A search for concepts and an instantiation of this approach. Then, a study of flexible querying systems...0灵活查询的方法,其中一些方法,包括SaintEtiQ,使用了模糊子集理论...0Using fuzzy subsets as a basis, we enrich the proposed approach with additional functionalities...0另一方面,我们将SaintEtiQ的语言摘要集成到了SGBD中...0PostgreSQL. The aim is to help the DBMS identify records. We present...0我们对索引技术的现状进行了调研,并详细介绍了...0Summaries as an access method in PostgreSQL.0关键词:SaintEtiQ,语言摘要,结构化数据,摘要查询...0Fuzzy subsets, flexible querying, cooperative aspects, indexing, indexing techniques...0访问方法,PostgreSQL。0本论文讨论了在查询过程中使用数据摘要的问题。所讨论的工作...0This thesis focuses on the linguistic summaries of the SaintEtiQ model, in which a summary describes...0关系表的内容。通过定义语言变量,可以使用术语...0From the natural language to characterize the structured data. In addition, the organization of...0将摘要根据概括链接组织成层次结构,提供了不同粒度的级别...0On one hand, we study the possible use of summaries in a descriptive querying process. The...0目标是基于部分特征完全描述数据。我们提出了...0An approach which consists in searching for specific concepts, from the expression of queries...0用于结果呈现的方法的实例化,使用了一个摘要层次结构...0A traversal algorithm is part of the proposal. Then, a survey of flexible querying systems, some...0其中一些基于模糊集合的方法,如SaintEtiQ,使我们能够提供额外的功能...0To the querying approach. On the other hand, we integrate linguistic summaries of the...0将模型存入DBMS PostgreSQL中。目标是帮助DBMS通过利用...识别元组。0Using a summary hierarchy as an index structure. We provide a survey of indexing techniques...0以及在PostgreSQL下实现摘要作为索引方法的详细信息。0关键词:SaintEtiQ,语言摘要,结构化数据,摘要查询,模糊查询。0集合,灵活查询,合作方面,索引,索引技术,访问方法,PostgreSQL。0greSQL。0致谢0我要感谢评审委员会的成员们给予我时间和关注。0感谢我的导师Noureddine Mouaddib先生,为我继续攻读博士学位提供了机会。0感谢我的导师提供了一个无缺陷的工作环境,并对我的工作进行了跟踪。0感谢我的导师Laurent Ughetto和Guillaume Raschia,为这个研究提供了实质性的帮助。0工作。0感谢Maeva的出席。0感谢我的家人,亲戚和朋友们对我的持续支持。0我特别感谢Hélène C.,Hélène M.,Alain M.和Joëlle M.。0最后,感谢我曾经遇到过的教育工作者,他们都参与了我的塑造。0塑造。0目录0— 文件正文 —0引言01 S AINT E TI Q模型摘要02 摘要查询算法03 灵活查询04 将S AINT E TI Q摘要应用于灵活查询05 数据索引06 将S AINT E TI Q摘要实现为访问方法0总结0— 附录页 —0参考文献0表格目录0图表目录0目录0IX10引言0问题,动机和目标0持续增长的存储容量似乎与技术进步有关。0技术。曾经有一个时代,每个比特几乎是勉强使用的,因为存储空间非常有限。0存储空间有限。Huffman算法[84]是其代表。0压缩技术,以更好地利用可用空间。对于0对于普通用户来说,存储容量的增长更多地意味着舒适:有更多的空间来存储0数据,不再担心存储问题,不需要再进行整理以腾出空间,只需0当需要时,可以通过增加容量来满足需求。但是这种增长也带来了需要处理的数据量的增加。0对于计算处理来说,数据量的增加是一个真正的问题,因为它导致了计算时间的增加。0需要处理的数据量的增加。0很明显,即使对于一个数据单元来说,处理速度再快也是不够的。0即使是辅助存储器,也会因为数据量的增加而“淹没”。0加密和解密对称密钥数据的方法非常常见。0即使速度非常快,也会导致时间成本的增加,例如在处理中进行的操作。0Ronald Rivest的RC4算法用于保护通信(例如Internet上的SSL和WiFi系统中的WEP)。但是,暴力破解攻击无法从中受益。0在互联网上的SSL和WiFi系统中使用的RC4算法用于保护通信。但是,暴力破解攻击无法从中受益。0但是,多处理器系统并没有从中受益[132]。同样,处理器分配的变化也会导致性能下降。0在抢占式多任务操作系统中,任务的切换会给人一种同时进行的错觉。0对于单处理器计算机来说,这种现象称为“抖动”,但所有系统都会遇到。0即使是最高性能的系统也会受到这些问题的影响。0数据量的增长为新的研究领域打开了大门。0在某些情况下,可以减轻数据量对处理时间的影响。0处理和算法的响应时间。相关处理可以满足逼近结果。0通常,近似结果的质量较低于非近似结果,但可以满足要求。0在可接受的时间内处理大量数据的方法之一是对样本进行抽样。01 暴力破解攻击是尝试使用所有可能的密钥来解密编码文本的方法。0这种解密方式需要确定解密后的文本是否可能是未知的原始明文。0在操作系统中,这种现象被称为“系统卡顿”。théorie des ensembles. Cet outil mathématique définit le concept d’appartenance partielle à un02 引言0或者是NP完全问题,可以通过近似解获得。0用于减轻数据量影响的方法之一是多项式算法。0在处理大量数据时,可以使用概括摘要方法。0计算处理面临的另一个问题是数据量的影响。0模拟“人类”或“自然”表示的困难。首先要提到的是渐变的概念。0另一个计算处理面临的问题是模糊性的定义。0状态的变化或特征的可变满意程度。渐变无法用二进制模式来表示。0二进制系统的二分法无法反映细微差别和其他渐变。0这些渐变被忽略,导致了“阈值效应”。例如,“身高必须是172厘米”这个条件排除了170厘米的身高。0“身高必须是172厘米”排除了170厘米的身高,尽管接近172厘米。同样,0一个人的“年轻”特征无法用二进制模式来表示:要么是,要么不是。0“年轻”或“不年轻”,但不能同时是两者,更不可能是其他的。0然后是偏好的概念,它表示一种愿望而不是强制约束。0不是数据库的基本元素,而且很难建模。0Zadeh提出的模糊子集理论[151]是集合论的推广,提供了解决由阈值效应引起的建模问题的方法。0例如,对描述性术语(“大”,“年轻”,“轻”,等)进行更多的表达。0集合论。这个数学工具定义了部分属于一个0或者具有模糊边界的类。模糊子集理论被用于0因此,可以表达渐进的特征,这在自然语言中很常见。0用“语言”术语来描述数据,因为它们来自自然语言。生成的摘要是0容易地表达渐进的特征,这在自然语言中很常见。0这篇论文中介绍的工作与数据缩减和0所有已知的摘要方法。它允许这些方法描述0模型S AINT E TI Q的结构化数据。该模型使用一组语言术语,其中0然后称为“语言摘要”。0的目标是生成数据的“缩减”版本。该过程的结果是0数据的语言描述。它确实处理了结构化数据的语言摘要。0该模型是数据缩减的一部分,就像其他摘要方法一样。0建模是明确渐进的,用于描述结构化数据。它还0在一般情况下,没有进一步的研究。我们在这里提出进一步研究摘要的方法。0因此,摘要是关系表内容的综合。因此,这个模型0S AINT E TI Q模型,研究由该模型生成的摘要层次结构的查询。0语言。然而,需要注意的是,一旦生成了摘要,就没有进一步的利用。0我们的目标是提供找到满足特定条件的摘要或数据的方法。0引言30参考文献中,读者将找到熟悉的查询、条件、结果和0模型。0数据摘要,SQL语言的丰富性是通过大量工作实现的。0指定的标准。关系模型及其查询语言SQL作为我们的模型和工具。0这个项目的目标是为S AINT E TI Q摘要提供缺失的查询工具。0评估或索引过程。然而,宣称的目标并不是在逻辑上复制0文档结构0几十年来一直是研究人员的关注点。我们的目标是更加谦虚的,是该领域的一部分。0目标是理解S AINT E TIQ摘要模型。它首先介绍了技术0数据摘要技术。0的目的是减少处理输入数据的体积,提供一种形式的0此文档由六个章节组成,组织如下。第一章的目的是0旨在保留最终应用程序所需的信息的技术。这一章0缩减技术使用数据缩减方法,其中包括摘要技术。这些技术是数据缩减的一部分。0是数据缩减技术。0在这种背景下,模型S AINT E TI Q的摘要位于此处(定量和/或定性的近似方法和类型)0在介绍之前,介绍了所考虑的数据的性质0在构建摘要时的一些因素(结构化数据和描述这些数据的词汇)。0在构建过程中的步骤,摘要的语法表示和属性。0属性,以及从这些表示和属性中可以推断出的信息。0第2章提出了一种查询S AINT E-摘要层次结构的方法0TI Q。查询被理解为搜索和展示满足查询条件的摘要0满足查询过程的输入条件的摘要。提议是关于0过程的输入,实际处理和输出。输入是一个规范表示0将查询表示为范式形式的逻辑条件。0处理是通过层次结构的探索算法实例化的,带有剪枝0其中详细介绍了与查询匹配的摘要的测试。0输出是以伪等价类的形式呈现的摘要结果0提出了与搜索标准相关的摘要展示。ditionnelles ainsi que des notions qui servent à caractériser les index. La deuxième partie, plus04 引言0第3章介绍了数据库灵活查询的现状。0从专门研究中综合出来,对灵活查询系统进行了分类0根据它们的理论基础进行分类。它还表明“偏好”的概念0这些系统的动机是其重要组成部分。因此,本章首先介绍了0一般方面的偏好以及一些灵活查询系统。0基于可用文档或历史兴趣选择的灵活查询系统。0第4章总结了我们的所有贡献,灵感来自查询系统0灵活查询,对S AINT E TI Q摘要的查询。首先,它介绍了一种实现0根据第2章提出的方法进行实施,用于近似查询0结构化数据的协作功能的原则。然后,它介绍了一种协作功能的原则0添加到摘要查询中。在查询系统中的合作性质0简要描述了这个系统,以及我们提供的结果选项0对无回答查询的处理。最后,本章介绍了我们在0这些思考是我们参与ACI APMD 3项目的一部分。0使用不同于摘要构建词汇的查询词汇。0在灵活查询方面也有一定的适用性,因为第3章介绍的系统0不假设唯一静态词汇。0这些系统的特点也是索引工作的起因。0这些系统确实需要访问数据以满足它们的偏好。0这些特点也是索引工作的起因。第5章因此对基本索引的研究进行了综述0在数据库管理系统(SGBD)中,索引被用于处理数据。0为了加快数据操作,使得对数据的访问相对快速0要处理的数据。本章的第一部分首先介绍了索引方法0这一章旨在为对S AINT E TI Q模型感兴趣的人提供快速参考。0技术,并对用于评估多维索引的属性和概念进行了总结。第二部分更加详细,涵盖了所谓的“多维”索引。0第6章研究了使用摘要层次结构访问数据的可行性。0本章研究了使用摘要层次结构访问数据的可行性。0它的目标是从摘要层次结构中定义索引结构。0索引的属性与S AINT E TI Q摘要进行了对比分析。0这项工作的目标是得出关于性能因素的结论,以及对其未来发展的展望。0关系表的数据。这项实证研究是在关系型数据库管理系统PostgreSQL中进行的。0引言50并实现传统访问方法(或索引技术)的操作。0在PostgreSQL数据库管理系统中,首次展示了使用摘要层次结构的可行性。03 Action Concertée Incitative “Accès Personnalisé à des Masses de Données”:项目MD 33 2004-20070这项工作的未来发展有多种可能性。0通过反馈,摘要的构建可以重新定义并适应索引的功能。这个目标在PostgreSQL数据库管理系统中取得了初步的成果。0S AINT E TI Q模型的摘要0虽然目标尚未完全实现,但本章详细描述了将其集成到基于语言摘要的索引结构中的步骤。0计算机系统存储的数据量越来越大,这给存储、系统互连等方面带来了挑战。70本文通过对所提出的整体工作进行总结,并展望了未来的发展方向。0存储大量数据需要适当的工具,能够实现多种功能,如存储、系统互连等。0第1章0解决数据量问题的一种方法是减少数据量,其中包括数据摘要。0引言0处理大量数据需要适当的工具,能够实现多种功能,如存储、系统互连等。0由于各种因素(存档、技术进步、支持数据的可用性等),处理大量数据变得越来越重要。0解决数据量问题的一种方法是减少数据量,其中包括数据摘要。0针对特定需求搜索相关信息。事实上,处理大量数据需要适当的工具,能够实现多种功能,0解决数据量问题的一种方法是减少数据量,其中包括数据摘要。0信息技术的目标是减少数据量。为此,有许多技术可以实现“扩展”。0减少数据量的一种解决方案是使用数据摘要。0摘要的目标是综合数据,即传达其核心内容,但以更紧凑的形式呈现。0以更紧凑的形式呈现数据。然而,这种方法也存在一些困难:如何涵盖所有重要信息,0减少摘要的数量,以及以易于理解的形式呈现摘要。0以易于理解的形式呈现摘要。0本章介绍的S AINT E TI Q模型是一种构建摘要的方法。0S AINT E TI Q模型是一种结构化数据摘要模型,由属性/值对组成。它与上述方法有所不同之处。0与任何摘要方法一样,这种摘要方法具有相同的野心,并面临着相同的困难。0然而,它有两个独特之处:注重可理解性和不同的抽象级别。0构建摘要,并生成描述数据的摘要,以不同的层次。0S AINT E TI Q模型的摘要0为了实现其目标,描述的过程使用了各种技术。0领域,如数据分析、数据挖掘、机器学习等。0甚至模糊子集理论都为数据摘要提供了语言摘要。0在1.2到1.6节中介绍了数据摘要的技术。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- 保险服务门店新年工作计划PPT.pptx
- 车辆安全工作计划PPT.pptx
- ipqc工作总结PPT.pptx
- 车间员工上半年工作总结PPT.pptx
- 保险公司员工的工作总结PPT.pptx
- 报价工作总结PPT.pptx
- 冲压车间实习工作总结PPT.pptx
- ktv周工作总结PPT.pptx
- 保育院总务工作计划PPT.pptx
- xx年度现代教育技术工作总结PPT.pptx
- 出纳的年终总结PPT.pptx
- 贝贝班班级工作计划PPT.pptx
- 变电值班员技术个人工作总结PPT.pptx
- 大学生读书活动策划书PPT.pptx
- 财务出纳月工作总结PPT.pptx
- 大学生“三支一扶”服务期满工作总结(2)PPT.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功