分布式数据库系统概论与设计关键点

5星 · 超过95%的资源需积分: 10 55 浏览量更新于2024-09-18 收藏 73KB DOC 举报

分布式数据库系统概述分布式数据库系统是一种特殊的数据库系统，它的特点是数据在物理上分散存储，但逻辑上呈现为一个整体。这种系统通过计算机网络将不同地理位置的数据库系统连接在一起，形成一个统一的数据库环境。分布式数据库系统的核心特征包括： 1. 物理分布性：数据分布在不同的节点或站点上，每个节点都有自己的存储空间。 2. 逻辑整体性：尽管数据分散，但从用户角度看，系统表现为单一、完整的数据库。 3. 站点自治性：每个站点都能独立处理事务，具有一定的自治能力。 4. 数据分布透明性：用户无需了解数据的确切分布位置，可以像使用集中式数据库一样操作数据。 5. 集中与自治相结合的控制机制：全局控制策略可以是集中式的，也可以是分散式的，或者可变的。 6. 数据冗余：为了提高可用性和容错性，系统通常允许适当的数据冗余。 7. 分布式事务管理：事务处理跨越多个节点，需要协调一致以保证数据的一致性。按照不同标准，分布式数据库系统可以分类如下： 1. 按数据模型分类：同构性（所有节点使用相同的数据模型）和异构性（节点间数据模型不同）。 - 同构同质型：所有节点使用相同的数据管理系统。 - 同构异质型：节点间可能存在不同的实现，但数据模型相同。 - 异构性：节点间数据模型和数据库管理系统可能完全不同。 2. 按全局控制系统类型分类：全局控制集中型、全局控制分散型和全局控制可变型。 - 全局控制集中型：所有控制决策由一个中心节点处理。 - 全局控制分散型：控制决策分散在各个节点之间。 - 全局控制可变型：控制机制可以根据需要动态调整。分布式数据库中的数据独立性和分布透明性是重要的概念。数据独立性确保用户不必关注数据的具体存储方式。分布透明性则涉及以下三个层次： 1. 分片透明性：用户不知道数据是如何被分片的。 2. 位置透明性：用户不知道数据具体存储在哪个站点。 3. 局部数据模型透明性：用户不必了解每个站点使用的具体数据模型。分布式数据库系统设计的目标是优化数据的分布，提高性能和可用性： 1. 本地性或近地性：尽量让数据与处理数据的应用程序位于同一站点，减少网络延迟。 2. 控制数据冗余：在保证可用性的前提下，尽可能减少不必要的数据复制。 3. 工作负荷分布：均衡地分配数据和计算任务，避免部分节点过载。 4. 存储能力和费用：考虑存储成本和扩展性，以适应不断变化的需求。水平分片是将全局关系按某一属性或属性集合进行划分，形成不相交的子集。初级分片基于关系自身的属性，而导出分片则是根据其他关系或规则推导出来的。例如，对于关系S(S#, SNAME, AGE, SEX)，可以通过初级分片按性别分组，创建两个不相交的片段，分别包含男性和女性员工的信息。分布式数据库系统提供了在大规模、分布式环境下的数据管理能力，通过精心设计和优化，可以有效地处理大量数据并提供高可用性服务。理解其特点、分类和设计原则对于构建高效、可靠的分布式系统至关重要。

分布式数据库系统及其应用复习大纲

第一章分布式数据库系统概述

1、理解分布式数据库系统的特点

分布式数据库系统的定义：

分布式数据库系统，通俗地说，是物理上分散而逻辑上集中的数据库系统。分布式数据库

系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位

（通常是集中是数据库系统）连接起来，共同组成一个统一的数据库系统。

分布式数据库系统的特点：１物理分布性：数据不是存放在一个站点上２逻辑整体性：是

与分散式数据库系统的区别３站点自治性：是与多处理机系统的区别４数据分布透明性５

集中与自治相结合的控制机制６存在适当的数据冗余度７事务管理的分布性

2、能够按照不同标准描述分布式数据库系统的分类

按局部数据库管理系统的数据模型分类：同构性（homogeneous）（分为同构同质型和

同构异质型）DDBS 和异构性(heterogeneous)DDBS

按分布式数据库系统的全局控制系统类型分类：全局控制集中型 DDBS，全局控制分散型

DDBS，全局控制可变型 DDBS。

3、理解分布式数据库中数据的独立性和分布透明性

所谓数据独立性是指用户或用户程序使用分布式数据库如同使用集中式数据库那样，不必

关心全局数据的分布情况，包括全局数据的逻辑分片情况、逻辑片段站点位置的分配情况

以及各站点上数据库的数据模型等。也就是说，全局数据的逻辑分片、片段的物理位置分

配，各站点数据库的数据模型等情况对用户和用户程序透明。所以，在分布式数据库中分

布独立性也称为分布透明性。

分布透明性包括三个层次：分片透明性（完全分布透明性）：映像 2

位置透明性（中级分布透明性）：映像 3

局部数据模型透明性（低级分布透明性）：映像 4

无分布透明性：异构数据

第二章分布式数据库系统设计

1、理解分布式数据库的设计目标

分布式数据库设计的目标 1 分布式数据库的本地性或近地性 2 控制数据的适当冗余 3 工作

负荷分布 4 存储的能力和费用

2、理解水平分片的定义、分类和应用

水平分片是对全局关系执行“选择操作”，把具有相同性质的元组进行分组，构成若干个不

相交的子集。水平分片的方法可归为初级分片和导出分片两类。

初级分片：以关系自身的属性性质为基础，执行“选择”操作，将关系分为若干个不相交的

片段。例子 2.1

S（S#，SNAME, AGE, SEX）

Dene fragment S1 as select * from where sex=’M’

Dene fragment S2 as select * from where sex=’F’

导出分片：全局关系的导出分片不是以其自身的属性性质为基础，而是从另一个关系的属

性性质或水平片段推导出来的。采用导出分片可片可使片段与片段之间的“连接”变得更容

下载后可阅读完整内容，剩余5页未读，立即下载

A8971230106

粉丝: 0
资源: 10

分布式数据库系统概论与设计关键点

《分布式数据库》实验报告

分布式数据库习题.doc

分布式数据库的存储引擎解析

分布式数据库架构与实现方式

Elasticsearch的分布式数据库集成

分布式数据库复制机制：数据同步与容灾，打造高可用系统

分布式数据库的横向扩展与高可用性

电网数据治理系统设计与实现.doc

软件详细设计文档模板(最全面)-详细设计文档.doc

hugeraph官网

最新资源