对分布式存储系统设计架构的理解
1、传统存储系统
今天和⼤家浅谈⼀下分布式存储设计⽅⾯我个⼈的⼀些理解。⾸先声明我本⼈不是
做研发的,只是⼀个有着 10年左右存储⾏业经验的普通⼯程师和产品经理。最早接
触存储是在 2010年,那时候说起存储⼤多指的是双控制器的磁盘阵列,⽐如:
EMC、IBM、HDS等,除了双控制器架构还有多控制器的所谓⾼端存储,这些统称
企业级存储。不过不管是中端的还是⾼端的,对于普通⼯程师来说都是⼀个⿊盒
⼦,我们并不知道其内部架构是什么样的,是怎么设计的,所了解的也只不过是产
品的规格参数啦,功能特性啦,基本上把这些跟⽤户讲明⽩,也就够了。⼩编我曾
经做过产品经理,和公司研发的同事了解过控制器架构的存储底设计的⼀些关键技
术,⽐如 Non Transparent Bridge(⾮透明桥):简单的理解就是通过 PCIE把两
个控制器连接在⼀起了。⽽为了使两个机器连接在⼀起,就发明了⼀种特殊的设备
叫做⾮透明桥,桥的两端是连接在两个控制器的 PCIE的总线上的,但是从任意⼀
端,只能看到这个桥,看不到这个桥后⾯接的下⼀级设备,这就是所谓的“⾮透明”
(因为⼀般的桥是透明的,你能看到桥后⾯的东⻄)。⾮透明桥就是⽤来做双控制
器的 cache mirror,所谓的缓存镜像,⽽现在的分布式架构很少有⼈⽤到这个技术。
图 1 传统磁盘阵列架构
2、分布式存储与传统存储的区别
然⽽,时过境迁,随着⽹络技术、分布式⽂件系统、计算机硬件的蓬勃发展,⽬前
的存储系统除了刚才提到的控制器架构的产品,基于 X86通⽤服务器平台的分布式
存储系统逐渐成为主流的存储形态。区别于控制器架构的存储系统的专⽤硬件,分
布式存储系统是运⾏在通⽤的 X86 PC 上的,在软件层⾯上基于分布式⽂件系统
(ceph、Lustre、Gluster、GPFS等),节点间⼀致性同步通过(ETCD、
Zookeeper 等)技术实现。现在我们通常把之前控制器架构的存储成为传统存储,
以区别于现在的分布式存储系统,我简单把⼆者的区别罗列了⼀下,如下表:
评论0