ceph工作原理和安装_安装ceph - CSDN文库

需积分: 12 7 浏览量更新于2023-05-18 评论收藏 852KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源评论

资源推荐

ceph 工作原理和安装

一、概述

Ceph

是一个分布式存储系统，诞生于

2004

年，最早致力于开发下一代高性能分布式文

件系统的项目。随着云计算的发展，

ceph

乘上了

OpenStack

的春风，进而成为了开源社区

受关注较高的项目之一。

Ceph

有以下优势：

1. CRUSH 算法

Crush

算法是

ceph

的两大创新之一，简单来说，

ceph

摒弃了传统的集中式存储元数据

寻址的方案，转而使用

CRUSH

算法完成数据的寻址操作。

CRUSH

在一致性哈希基础上很好

的考虑了容灾域的隔离，能够实现各类负载的副本放置规则，例如跨机房、机架感知等。

Crush

算法有相当强大的扩展性，理论上支持数千个存储节点。

2. 高可用

Ceph 中的数据副本数量可以由管理员自行定义，并可以通过 CRUSH 算法指定副本的物

理存储位置以分隔故障域，支持数据强一致性； ceph 可以忍受多种故障场景并自动尝试并

行修复。

3. 高扩展性

无论使用哪种存储方式（对象、块、挂载），存储的数据都会被切分成对象（

Objects

）。

Objects size

大小可以由管理员调整，通常为

2M

或

4M

。每个对象都会有一个唯一的

OID

，

由

ino

与

ono

生成，虽然这些名词看上去很复杂，其实相当简单。

ino

即是文件的

File ID

，

用于在全局唯一标示每一个文件，而

ono

则是分片的编号。比如：一个文件

FileID

为

A

，它

被切成了两个对象，一个对象编号

0

，另一个编号

1

，那么这两个文件的

oid

则为

A0

与

A1

。

Oid

的好处是可以唯一标示每个不同的对象，并且存储了对象与文件的从属关系。由于

ceph

的所有数据都虚拟成了整齐划一的对象，所以在读写时效率都会比较高。

但是对象并不会直接存储进

OSD

中，因为对象的

size

很小，在一个大规模的集群

中可能有几百到几千万个对象。这么多对象光是遍历寻址，速度都是很缓慢的；并且如果将

对象直接通过某种固定映射的哈希算法映射到

osd

上，当这个

osd

损坏时，对象无法自动迁

移至其他

osd

上面（因为映射函数不允许）。为了解决这些问题，

ceph

引入了归置组的概

念，即

PG

。

PG

是一个逻辑概念，我们

linux

系统中可以直接看到对象，但是无法直接看到

PG

。

它在数据寻址时类似于数据库中的索引：每个对象都会固定映射进一个

PG

中，所以当我们

要寻找一个对象时，只需要先找到对象所属的

PG

，然后遍历这个

PG

就可以了，无需遍历所

有对象。而且在数据迁移时，也是以

PG

作为基本单位进行迁移，

ceph

不会直接操作对象。

对象时如何映射进

PG

的？还记得

OID

么？首先使用静态

hash

函数对

OID

做

hash

取出特征码，用特征码与

PG

的数量去模，得到的序号则是

PGID

。由于这种设计方式，

PG

的数量多寡直接决定了数据分布的均匀性，所以合理设置的

PG

数量可以很好的提升

CEPH

集群的性能并使数据均匀分布。

剩余36页未读，继续阅读

评论0

lanlingzhifeng-wh

粉丝: 4
资源: 4

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈