CRUSH：分布式存储的智能数据分布算法

需积分: 9 46 浏览量更新于2024-09-14 收藏 729KB DOCX 举报

"CRUSH是Controlled, Redundant, Scalable, Hash-based (可控制的，冗余的，可扩展的，基于哈希的)的缩写，它是一种用于大规模分布式存储系统的算法，旨在实现数据的高效、均衡分布以及在存储设备之间的智能故障处理。" CRUSH算法的核心目标是解决大规模分布式存储系统中的数据分布和负载均衡问题。这种系统通常涉及到PB级别的数据在成千上万个存储设备间的分布。CRUSH设计的主要特点包括以下几个方面： 1. 可控的分布：CRUSH使用一种可扩展的伪随机函数来映射数据对象到存储设备，这样就不需要中心化的目录服务。这种分布式的方法允许系统在不依赖单一控制点的情况下运行，增加了系统的健壮性。 2. 扩展性：随着系统规模的增长，CRUSH算法能够有效地处理设备的添加和删除。它能够在设备动态变化的情况下，通过数据迁移策略保持负载均衡，最小化不必要的数据移动。 3. 散布式冗余：CRUSH支持多种数据同步和可靠性机制，可以根据用户定义的策略将数据副本分散到不同的故障域，确保数据的安全性和可用性。例如，通过副本复制，即使某些设备故障，数据仍然可以被访问。 4. 动态适应性：由于大型存储系统的动态性，CRUSH算法被设计得足够灵活，以适应不同的工作负载和系统变化。例如，当新设备加入或旧设备退出时，CRUSH可以智能地调整数据分布，避免数据过于集中或不平衡。 5. 避免数据重组：与简单的哈希分布不同，CRUSH算法能够更好地应对设备数量的变化，减少因设备增减而导致的大规模数据重组，从而降低系统性能的波动。 6. 平衡负载：通过概率性的数据分布策略，CRUSH使得所有设备的负载趋于均衡，无论是在新设备添加还是在处理故障时，都能保证系统的整体性能。 7. 提高并行性：在大型系统中，文件的数据被分散到大量设备上，促进了数据读写的并行性，提高了系统的整体吞吐量和聚合带宽。总结来说，CRUSH算法是为了解决大规模分布式存储系统的挑战而设计的，它通过智能的数据分布策略实现了系统的扩展性、负载均衡和容错能力，为构建高效、可靠的存储基础设施提供了理论和技术支持。在实际应用中，CRUSH被广泛应用于对象存储系统，如Ceph等，为云存储和大数据环境提供了强大的数据管理解决方案。

总和。

容器可以任意组合来构成一个层次，

该层次代表可利用存储。例如，通过“架子”

容器在最底层建立集群映射来表示在他们

安装时一组相同的设备，然后将这些架子

合并成“柜子”容器，即将安装时在同一个机

架上的组合起来。柜子会为了一个大型系

统更进一步组合成“行”或“空间”容器。通过

伪随机类哈希函数来递归选择嵌套容器项

目，从而将数据放置在层次结构中。相比

传统的哈希技术，目标设备的任何改变都

将导致设备上下文的巨大改组，CRUSH 是

基于四种不同的容器类型，每种容器类型

都有不同的选择算法用于解决设备添加或

删除和整体计算复杂度所导致的数据移动。

3.2 副本放置

CRUSH 是用来在加权设备之间均匀分

发数据，以保持存储利用率和设备带宽资

源的统计学平衡。在层次结构中，存储设

备上的副本放置也是对数据安全的关键影

响。通过反映装置的底层物理组织，

CRUSH 可以模仿——因此也可解决——相

关设备故障的潜在来源。典型的来源包括

物理邻近，共享电源和共享网络。通过将

这个信息编码成集群映射，CRUSH 放置政

策可分离在不同故障域的副本对象，同时

仍保持所希望的分布。例如，要解决并发

故障的可能性，我们希望确保数据的副本

在不同货架的设备，机架，电源供应器，

控制器，和/或物理位置中。

为了适应各种各样可能使用 CURSH 的

情景，依据数据副本策略和底层的硬件配

置中，CRUSH 为每个副本策略或分配政策

配置定义了放置规则，从而允许存储系统

或管理员来明确指定如何放置对象副本。

例如，可能有规则是为了 2-路镜像选择一

对目标，也有为 3 路镜像在两个不同数据

中心选择 3 个目标，也有为 RAID-4 在超过

6 个存储设备中选取目标等等。

每个规则都包含一系列操作应用在简

单运行环境的层次上，算法 1 伪代码如下：

算法 1 对象 x 的 CRUSH 放置算法

CRUSH 函数是整数作为输入，x 通常是

一种对象名称或其他准标识符，比如副本

在相同设备的一组对象中的准标识符。

Take(a)操作是在存储层次中选择一个项目

（通常是容器），并赋给，作为后续操

作的输入。select(n,t)操作迭代每一个在中

的元素，然后在以该节点为根的子树上选

择 n 个类型为 t 的不同项目。存储设备有一

个已知，固定的类型，且系统中的每个容

器都有一个类型字段，该字段用于区分容

器的类别（例如，这些表“行”和这些表“柜

子 ” ）。对于每个， select(n,t) 遍历

个请求项，通过任意中间容器递归

减少，使用函数 c(r,x) 在每个容器中伪随机

选择一个嵌套项目（在章节 3.4 中为每种容

器定义），直到它发现一个项目是所要请

求的类型 t。结果即个不同的项目被放置

剩余10页未读，继续阅读

gripleaf

粉丝: 18

CRUSH：分布式存储的智能数据分布算法

Ceph常用命令总结大全.docx

【7】Ceph分布式存储架构搭建.docx

3.HAMILTON COUNTY JUDGES.docx

ceph集群部署.docx

ceph集群搭建.docx

Ceph原理描述.docx

Ceph技术架构白皮书.docx

Ceph技术架构介绍.docx

开源分布式文件系统比较.docx

开源Ceph10.2.1源码分析.docx

最新资源