没有合适的资源?快使用搜索试试~ 我知道了~
首页Greenplum详细使用手册(新手必备)
资源详情
资源评论
资源推荐
管理员指南
本书基于 版本
管理员指南
第一章架构简介
是一个分布式数据库软件
其可以管理和处理分布在多个不同主机上的海量数据。
对于 来说一个 实例实际上是由多个独立的 实例组成的它们分
布在不同的物理主机上协同工作呈现给用户的是一个 的效果。是
系 统 的 访 问 入 口 其 负 责 处 理 客 户 端 的 连 接 及 命 令 、 协 调 系 统 中 的
其 他
!工作负责管理和处理用户数据。
这一章节阐述组成 系统的组件及如何协同工作
"
管理节点
"
计算节点
"
网络
"
冗余与故障切换
"
并行数据装载
"
管理与监控
管理节点
作为 系统的访问入口其处理客户端连接的访问以及用户提交的 语句。
是基于 发展而来终端用户可以像 那样与 进行交互。
并同样可以通过客户端程序 如 #!和应用程序接口 $ 如 %&、'&!!连接 。
上存储着全局系统表 ()&! 包含 系统自身元数据的系统
表!但不存储任何用户数据用户数据只存储在 上。 负责客户端认证、
处理 命令入口、在 之间分配工作负载、整合 处理结果、将最终
管理员指南
结果呈现给客户端程序。
计算节点
在 系统中才真正是数据存储和查询处理的地方。用户 *(和相应的
+,都分布在 系统中各 上每个 存储着一部分不同的数据。
实例 !才是真正的数据处理进程。用户不能够直接跳过 访问
而只能通过 来访问整个系统。
在 推荐的硬件配置环境下每个有效的 &-核对应一个 比如
一个 主机配备了 个双核的 &-那么可以选择每个 主机 配置个
主实例 .)!。
网络
网络层是 系统的重要组件在用户执行查询时每个 都需要执行相应的
处理网络层涉及到 之间的通信网络层可以使用标准的以太网络协议。
在默认情况下网络层使用 -协议。自己会为 -协议做数据包校验其可
靠性与 *&协议相同但其性能和扩展性远好于 *&协议。在使用 *&协议的情况下
的 数量被限制在 个。为了去除这个限制-协议被作为默认的网
络层协议。
冗余与故障切换
提供了避免单点故障的部署选项。本节阐述 的冗余组件。
"
镜像
"
镜像
"
网络层冗余
镜像
在部署 系统时可以选择配置 .。.使得数据库查
询在 .)不可用时切换到备份的 上。为了配置 .
系统需要有足够多的 /
从而可以保证冗余的 总是在与 .)
不同的 /主机上。下图展示了在配置了 .的情况下数据如何分布
在不同的 /节点上。.总是位于不同于 .)的 /主
机上。
0管理员指南
故障切换与恢复
在 系统 .启用的置情况下当 .)不可访问时系统会自
动切换到其对应的 .上此时.取代 .)
的作用。只要剩余的可用 能够保证数据完整性在
或者 /主机宕机时系统仍可保持可用状态。
每当 无法连接到 .)时其都会在 的系统日志表中被标
记为失败状态并激活1唤醒对应的 .取代原有的 .)。
在采取相应的措施将其恢复到联机 '.!状态之前失败的 .)一直
保持未运行状态。失败的 .)可以在系统处于运行状态下被恢复回来。
恢复进程仅仅复制失败期间发生变化的那部分数据。
在未启用 .的情况下任何的 失败都会导致系统自动停止服
务。在继续使用系统之前必须恢复所有失败的 。
镜像
同样可以为 部署一个备份1镜像到一个不同于 节点的主机上。在
不可用时+()就成为了热备 。+()与 之间保持事务
日志的同步其保证 +()与 之间的一致性。
在 失效时复制进程会自动停止同时+()可以被激活。在 +()
上冗余的日志被用来将状态恢复到最后成功提交 .!的状态。激活的 +()
实际上会成为 的 通过 该端口需要设置和 的相同!
接受客户端的链接访问。
由于 不存储用户数据在 和 +()之间仅仅是系统信息表需要被
同步。这些表很少发生变化一旦发生变化就会自动同步到 +()从而保证与
的一致性。
管理员指南
网络层冗余
网络层关系到 之间的通信其依靠基础网络设施高可用网络层
可以通过部署双重以太网络实现。不过如果在配置 .的情况下通过不同网
段间的 .)与 .之间的对应关系也可以达到网络保障的效果。
并行数据装载
海量数据仓库的一个重大挑战就是在一个给定的时间窗口内完成大量数据的装载。
通过外部表 2,*(!支持高速并行数据装载。外部表可以使用‘单条记录出错隔
离’模式从而允许管理员在装载数据时将出错的数据记录剥离到一个单独的错误记录
表中。管理员还可以控制错误容忍阀值以实现对数据装载质量的控制。
结合使用外部表和 的并行文件服务 3+.!管理员可以实现最大化利用网络带
宽资源以实现高速并行装载。
4管理员指南
管理与监控
对 系统的管理通过一系列的命令行来实现它们都放置在5/'21(.目录下。
提供的命令可以实现如下的管理任务
"
批量安装 软件
"
初始化 系统
"
启动关闭 系统
"
添加或移除 /主机
"
扩展 以及在新节点间重新分布 *(
"
监控和恢复失败的
"
监控和恢复失败的
"
备份和恢复数据库 并行!
"
并行装载数据
"
系统状态报告
还提供了一个可选的监控管理工具管理员可以选择与 一起安装和启用。
&& &+&!使用数据收集代理程序 $!在各个 /
收集数据库的指标。$会定期 比如 4秒!主动将 上收集的数据发
送给 。用户可以直接查询 &&数据库查看系统指标。&&还有一个基于 62的
图形化用户交互界面服务其可以独立于 安装。
7管理员指南
第二章分布式数据库概念
是一个分布式数据库系统。这就意味着在物理上数据是存储在多个数据库服务上
的 在 中称为 !。这些独立的数据库服务通过网络进行通信 在 中
称为网络层!。分布式数据库的一个基本特征是用户和客户端程序如同访问一个单机
数据库 在 这个入口数据库称为 !。数据库分布在不同的机器上但对于用
户来说如同使用一个单机数据库一样。
数据是如何存储的
要理解 是如何在不同的 之间存储数据如下图所示的简单逻辑
数据库主键 .)8)!被使用黑体标记外键 9.8)!关系通过连线标明。
用数据仓库的术语来说这种数据模型称为星型模型。在这种数据库模型下表通
常被称为事实表 9*(!其他表 &、:+、+!被成为维表 ..
*(!。
系统中所有的用户表都是分布的这意味着数据被拆分成无重叠的记录集合。每
部分存储在一个 中。数据通过复杂的 /$/算法分布到所有
。/$/82; 一个或者多个!由管理员在定义 *(时指定。
从底层上来说
通过一系列相关的独立 (实现——个
和数个 。
不存储用户数据。
存储每张表无重叠的部分数据 记录集合1&<'3=>!。
?管理员指南
解读 分布策略
在 中创建 &!或者修改 $!表时有一个额外的 *=-*2子句用以
定义表的分布策略 ..(<.)!。分布策略决定了表中的数据记录如何被打散
到 的 。提供了 种分布策略
"
/$/分布
使用 /$/分布时个或数个 *(&被用作 ..(<8) 简称 8!。8
被 /$/算法用来决定每行记录对应特定的 。相同 8)值的记录
会 /$/到相同的 。选择一个唯一键 .#@)!作为 8比如主
键 .)8)!可以确保尽可能的平坦分布数据。
"
随机 =+!分布
使用随机分布数据记录被循环的分布到 。相同值的记录可能会
落在不同的 。随机分布可以确保数据分布的平坦性但为了确保
性能优势应该尽可能的使用 /$/分布。
A管理员指南
第三章特性摘要
本章概述 的系统要求及相关特征。包含以下论题
"
标准一致性
"
与 兼容性
标准一致性
语言在 BA7年首次由美国国家标准协会 $C!标准化。随后的版本由 $C发布并
由国际标准化机构 '!标准化BABBB07及目前的标准
A。官方标准化名称为 '12&B?4A。通常新版的标准会增加一些特性
偶尔也会有特性被建议废弃或者剔除。
值得一提的是目前还没有一款商业数据库系统完全符合 标准。是几乎完全
符合 BB标准符合大部分的 BBB标准。数个来自 0标准的特性被实
现 尤其是大部分的 '$特性!。
本章重点阐述 与 标准间的关系。对 标准一对一的特性支持列表可参
见相关附录DA标准可选特性支持”。
核心 一致性
由于 采用的是无共享 E+CE.!架构
的查询优化器对于一些
结构目前还没有实现。下面这些 结构是不被支持的
一些在 2F*或 C'*2F*子句中有返回值的子查询其无法被 的查询优
化器重写为 %'C。
表 %'C且有子查询时的 -C'C$语法。
0在 9='作用的子查询中有记录集返回的 9-C&*'C。
反向滚动游标 &-='=!包括 92*&/='=、92*&/9=*、92*&/$'-*2、
和 92*&/=2$*:2。
4在使用 &=2$*2*$2语句时-C'C或者 =$=;82;子句必须包含所有 8
列 若有 8!。出于这个限制仅有一个 -C'C或者 =$=;82;子句可被使
用在 &=2$*2*$2语句中。而对于 *=-*2=$C';的表来说不允许
使用 -C'C和 =$=;82;子句。
7&=2$*2-C-2C2F子句未包含全部 8列。 &=2$*2-C-2C2F不可用在
*=-*2=$C';表。
?:'$*2或者 *$2的 9-C&*'C不能在 得到执行因此只
能将字面值作为参数传递给这些函数。
A触发器 *.!不被支持虽然其依赖于 :'$*29-C&*'C。
B外键 9.8)!的参考约束在 中不生效。用户仍可以定义外键并且
这些信息也会保存在系统信息表中。
序列 #!操作函数 &-==:$和 $*:$。
22*26/2=2&-==2C*'9和 -$*26/2=2&-==2C*'9 指定游标删除和更
新操作!。
B管理员指南
BB一致性
剩余63页未读,继续阅读
草芥茶
- 粉丝: 5
- 资源: 10
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论2