高可用的高可用的MongoDB集群详解集群详解
1.序言
MongoDB 是一个可扩展的高性能,开源,模式自由,面向文档的数据库。 它使用 C++编写。MongoDB 包含一下特点:
1.面向集合的存储:适合存储对象及JSON形式的数据。
2.动态查询:Mongo 支持丰富的查询方式,查询指令使用 JSON 形式的标记,可轻易查询文档中内嵌的对象及数组。
3.完整的索引支持:包括文档内嵌对象及数组。Mongo 的查询优化器会分析查询表达式,并生成一个高效的查询计划。
4.查询监视:Mongo包含一个监控工具用于分析数据库操作性能。
5.复制及自动故障转移:Mongo 数据库支持服务器之间的数据复制,支持主-从模式及服务器之间的相互复制。复制的主要目的是
提供冗余及自动故障转移。
6.高效的传统存储方式:支持二进制数据及大型对象(如:照片或图片)。
7.自动分片以支持云级别的伸缩性:自动分片功能支持水平的数据库集群,可动态添加额外的机器。
2.背景
MongoDB 的主要目标是在键值对存储方式(提供了高性能和高度伸缩性) 以及传统的 RDBMS(关系性数据库)系统,集两者的优
势于一身。Mongo 使用 一下场景:
1.网站数据:Mongo 非常适合实时的插入,更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性。
2.缓存:由于性能很高,Mongo 也适合作为信息基础设施的缓存层。在系统重启之后,由 Mongo 搭建的持久化缓存可以避免下层
的数据源过载。
3.大尺寸,低价值的数据:使用传统的关系数据库存储一些数据时可能会比较贵,在此之前,很多程序员往往会选择传统的文件进行
存储。
4.高伸缩性的场景:Mongo非常适合由数十或数百台服务器组成的数据库
5.用于对象及JSON数据的存储:Mongo的BSON数据格式非常适合文档格式化的存储及查询。
注:这里需要说明下,本文旨在介绍高可用的 MongoDB 集群;这里不讨论 Hadoop 平台的 HDFS。可根据公司实际业务需求,选择
合适的存储系统。
当然 MongDB 也有不适合的场景:
1.高度事务性的系统:例如银行或会计系统。传统的关系型数据库目前还是更适用于需要大量原子性复制事物的应用程序。
2.传统的商业智能应用:针对特定问题的 BI 数据库会对产生高度优化的查询方式。对于此类应用,数据仓库可能时更适合的选择
(如Hadoop套件中的Hive)。
3.需要SQL的问题。
3.搭建
3.1环境准备
在 Mongo 的官网下载 Linux 版本安装包,然后解压到对应的目录下;由于资源有限,我们采用 Replica Sets + Sharding 方式来配
置高可用。结构图如下所示: