关系模型:大型共享数据库的核心理论

5星 · 超过95%的资源 需积分: 11 10 下载量 166 浏览量 更新于2024-12-03 收藏 1.4MB PDF 举报
"这篇论文是数据库领域的经典之作,由E.F. Codd撰写,题为‘大型共享数据库的关系模型’,在数据存储和检索领域具有里程碑意义。文章探讨了传统非推理、格式化的数据系统(如树状结构文件和网络模型)的局限性,并提出了一种基于n-元关系的新模型,旨在保护大型数据库的用户免于了解数据在机器中的内部表示(内部结构),以实现数据表示变化时用户接口的稳定性。" 在本文中,E.F. Codd提出了关系模型的概念,这是现代关系数据库的基础。他指出,未来的大型数据银行用户应该无需关心数据在计算机内的具体组织方式(即内部表示)。这是因为随着查询、更新和报告需求的变化,以及存储信息类型的自然增长,数据的内部表示可能需要频繁调整。传统的文件系统,如树形结构和稍微更灵活的网络模型,无法满足这种灵活性需求。 Codd在第1节中详细阐述了这些传统模型的不足之处。他提出的关系模型基于n-元关系,这是一种数据基的正规形式。n-元关系意味着数据可以被看作是多个属性之间的多对多关系集合,而不仅仅是一对一或一对多的层次或网络结构。这种方法允许更复杂的数据结构,同时保持了逻辑上的简单性和独立性。 关系模型的核心思想是表(Table),其中每个表代表一个关系,包含了若干行(Records)和列(Attributes)。每行代表一个特定实例,每列代表一个特定的属性。此外,他还引入了关系代数,这是一种用于查询和操作关系数据库的数学语言,包括选择(Selection)、投影(Projection)、并集(Union)、差集(Difference)等操作。 Codd的模型强调了数据独立性,分为外模式(External Schema)、模式(Schema)和内模式(Internal Schema)三个层次。外模式是用户看到的数据视图,模式是数据库的整体结构,而内模式则是数据的实际物理存储方式。通过这种方式,即使数据库的内部结构发生变化,用户的查询和应用程序也可以保持不变,这被称为“逻辑独立性”。 此外,Codd还提出了著名的Codd的12条规则,这些规则定义了一个完整的关系数据库管理系统应具有的特性,包括事务处理、安全性、恢复性等,对后来的数据库设计和发展产生了深远影响。 “大型共享数据库的关系模型”这篇论文为现代数据库系统奠定了理论基础,它的贡献在于提出了关系模型,促进了数据库管理系统的标准化和规范化,使得数据的管理和访问变得更加高效和灵活。