大型共享数据库的关系模型

需积分: 11 9 下载量 9 浏览量 更新于2024-09-10 收藏 1.4MB PDF 举报
"A Relational Model of Data for Large Shared Data Banks是数据库领域的经典论文,由E.F. Codd撰写,他在文中提出了关系模型的概念,旨在为大型共享数据库提供一种数据组织方式,保护用户免于了解数据在机器内部的具体组织结构(内部表示)。" 这篇论文的核心观点在于,未来的数据库用户不应被要求理解数据在计算机中的具体存储形式,因为这种内部表示可能会随着查询、更新和报告需求的变化以及存储信息类型的自然增长而经常需要改变。Codd提出,仅仅提供一个提示服务来提供这些信息是不够的,用户终端的活动和大多数应用程序应不受内部表示变化的影响,甚至部分外部表示的变化也不应影响它们。 在论文的第一部分,Codd讨论了现有非推理、格式化数据系统的不足,例如基于树结构的文件和稍微更通用的网络模型。他认为这些模型在处理复杂的数据关系时存在局限性。作为替代方案,他引入了一种基于n元关系的关系模型,这是一种数据基的正常形式。这种关系模型允许数据以表格的形式存储,每个表代表一个关系,其中的行表示记录,列表示属性,每个元组(行)代表实体的一个实例。 关系模型的一个关键特性是它的关系代数,这是一种形式化的查询语言,用户可以通过它来检索和操作数据,而无需了解底层的存储细节。Codd还强调了关系数据库的规范化理论,即数据应通过一系列的规范化过程来组织,以减少数据冗余和提高数据一致性。他提出了若干个范式,如第一范式(1NF)、第二范式(2NF)和第三范式(3NF),这些范式是后来数据库设计的基础原则。 此外,Codd的论文还涵盖了事务处理、并发控制和恢复机制,这些都是确保大型共享数据库一致性和可靠性的关键元素。他还提出了著名的Codd's 12 Rules,这些规则定义了一个系统是否可以被视为真正的关系数据库管理系统(RDBMS)的标准。 "A Relational Model of Data for Large Shared Data Banks"是数据库理论的重要里程碑,它奠定了关系数据库的基础,对后续的数据库系统设计产生了深远影响,包括当今广泛使用的SQL(结构化查询语言)和众多商业与开源的RDBMS产品。