没有合适的资源?快使用搜索试试~ 我知道了~
首页greenplum的运维使用手册.docx
Greenplum的架构采用了MPP(大规模并行处理)。在 MPP 系统中,每个 SMP节点也可以运行自己的操作系统、数据库等。换言之,每个节点内的 CPU 不能访问另一个节点的内存。 节点之间的信息交互是通过节点互联网络实现的,这个过程一般称为数据重分配(Data Redistribution) 。与传统的SMP架构明显不同,通常情况下, MPP系统因为要在不同处理单元之间传送信息,所以它的效率要比SMP要差一点,但是这也不是绝对的,因为 MPP系统不共享资源,因此对它而言,资源比SMP要多, 当需要处理的事务达到一定规模时,MPP的效率要比SMP好。这就是看通信时间占用计算时
资源详情
资源评论
资源推荐

Greenplum 运维手册
编写者:

一: greenplum 的使用
1.1 greenplum 的概述与架构
1.1.1.greenplum 的概述:
。该公司成立于 年, 年推出了首款产品,其主营业务关注在数
据仓库和商业智能方面, 软件可以在虚拟化 服务器上运行无分享
( )的大规模并行处理(!"")架构
当前使用的 #$%" 程序中,用户访问一个中心数据库,如果采用 &!" 系统结构,它的效
率要比采用 !"" 结构要快得多。而 !"" 系统在决策支持和数据挖掘方面显示了优势,
可以这样说,如果操作相互之间没有什么关系,处理单元之间需要进行的通信比较少,那
采用 !"" 系统就要好,相反就不合适了。
1.1.2. mpp 系统
'''' 的架构采用了 !""(大规模并行处理)。在 !""系统中,每个 &!" 节点
也可以运行自己的操作系统、数据库等。换言之,每个节点内的 *"+不能访问另一个节
点的内存。
''''节点之间的信息交互是通过节点互联网络实现的,这个过程一般称为数据重分配
(,-)。与传统的 &!" 架构明显不同,通常情况下,
!"" 系统因为要在不同处理单元之间传送信息,所以它的效率要比 &!" 要差一点,但是
这也不是绝对的,因为 !"" 系统不共享资源,因此对它而言,资源比 &!" 要多,
当需要处理的事务达到一定规模时,!"" 的效率要比 &!" 好。这就是看通信时间占用计
算时间的比例而定,如果通信时间比较多,那 !"" 系统就不占优势了,相反,如果通信时
间比较少,
那 !"" 系统可以充分发挥资源的优势,达到高效率。

1.2 greenplum 的体系架构
由三部分组成:!.、& 、//。
1.2.1、Master Host.
!.节点是访问系统的入口,数据库侦听进程 ( ),处理所有用户
连接,建立查询计划,协调工作处理过程,管理工具,系统目录表和元数据(数据字典)
并不存放任何用户数据。
1.2.2、segment 节点
每段(& )存放一部分用户数据,一个系统可以有多段,用户不能直接
存取访问,所有对段的访问都经过 !,数据库监听进程( )监听
来自 !的连接

1.2.3、Interconnect
数据库之间的连接层,进程间协调和管理,基于千兆以太网架构,属于系
统内部私网配置,并支持两种协议:%*"+"
1.3、greenplum 的表的分布策略
在 0 中,有 种分布策略:
哈希分布,随机分布
在 中,添加了另一个策略:
哈希分布,随机分布,复制分布
数据表的单个行会被分配到一个或多个 上1
二:greenplum 的部署

2.1 系统软件准备
系统: *#&213
部署环境:
一台
-一台
三台
扩容集群 二台
系统主机名配置:
//
451414144411/
4514141411/
4514141411/
451414143311/
451414140011/
4514141411/
451414142211/
部署 建议生产使用实体机器, 的最小环境为,一台
-一台 三台
2.2 系统环境初始化
2.2.1 系统内核参数优化
cat >> /etc/sysctl.conf << EOF
fs.aio-max-nr = 1048576
fs.'le-max = 6815744
net.ipv4.ip_local_port_range = 9000 65500
net.ipv4.conf.default.accept_source_route = 0
剩余63页未读,继续阅读













安全验证
文档复制为VIP权益,开通VIP直接复制

评论0