Cassandra分布式数据库深度解析：模型与源代码探索

4星 · 超过85%的资源需积分: 0 140 浏览量更新于2024-08-01 收藏 1.77MB DOCX 举报

"Cassandra分布式模型与源代码分析" Cassandra是一个强大的开源分布式数据库系统，它融合了Dynamo的Key/Value特性和Bigtable的列族（Column Family）数据模型。这个系统最初由Facebook开发，目的是处理大规模的数据存储需求，目前已被Twitter、Facebook等公司广泛采用。Cassandra的主要特点是其高度灵活的模式设计、出色的可扩展性以及对多数据中心的支持。 1. **灵活的模式设计** Cassandra允许用户在运行时动态地添加或删除字段，无需预先定义严格的schema。这种灵活性使得它能够适应不断变化的数据需求，对于那些需要频繁调整数据结构的应用尤其适用。 2. **分布式特性** Cassandra的核心是分布式网络服务，它将数据分布在多个节点上，实现了数据的复制和分布。每个节点都可以执行读写操作，并且通过Gossip协议进行节点间的通信和状态同步，确保了高可用性和容错性。即使单个节点出现故障，整个集群仍能继续提供服务。 3. **基于列的结构化** 与传统的行式数据库不同，Cassandra采用列族数据模型，数据以键值对的形式存储，键可以进一步细分为行键和列键。这种结构有利于高效地进行范围查询和列选择，减少了不必要的数据传输。 4. **高可扩展性** Cassandra的水平扩展能力非常出色，只需要向集群中添加新的节点，系统就能自动平衡负载，将数据分散到新节点上。无需停机、修改查询或手动迁移数据。 5. **多数据中心支持** 通过在多个地理位置部署数据中心，Cassandra可以实现跨区域的数据复制，确保在某个数据中心出现问题时，其他数据中心仍能提供服务，增强了系统的健壮性。 6. **范围查询与列表数据结构** Cassandra支持范围查询，用户可以根据键的范围来检索数据。此外，其混合模式还允许使用超级列（Super Column），形成类似五维哈希的数据结构，进一步增强了数据组织的灵活性。 7. **分布式写操作** 写入Cassandra的数据会被复制到多个节点，确保了数据的一致性和可靠性。读操作则根据一致性级别路由到适当的节点，提供不同的读取性能和数据新鲜度的权衡。 8. **应用案例** 在实际应用中，Twitter和Facebook等社交媒体平台利用Cassandra处理海量的用户生成数据，如时间线、消息和用户偏好等。通过对Cassandra的源代码分析，开发者可以深入了解其内部工作原理，优化查询性能，解决潜在的问题，并根据具体需求进行定制化开发。Cassandra是一个强大的工具，适合处理大规模、分布式的数据存储和检索任务。

2.8.5.7Existing Cluster (Upgrade from 0.6)

To provide some backwards compatibility, we've provided a JMX method in

the StorageServiceMBean that can be used to manually load schema definitions

from storage-conf.xml. This is a one-shot operation though, and will only work

on a system that contains no existing migrations. If you are upgrading a cluster,

you will probably only have to do this for one node (a seed). Gossip will take

care of promulgating the changes to the rest of the nodes as they come online.

For those who dont know how to do it (like me):

ps aux | grep cassandra # get pid of cassandra

jconsole PID

MBeans -> org.apache.cassandra.service -> StorageService -> Operations ->

loadSchemaFromYAML

2.8.5.8Concurrency

It is entirely possible and expected that a node will receive migration pushes

from multiple nodes. Because of this, all migrations are applied on a

single-threaded stage and versions are checked throughout to make sure that

no migration is applied twice, and no migration is applied out of sync.

Each migration knows the version UUID of the migration that immediately

precedes it. If a node is asked to apply a migration and its current version

UUID does not match the last version UUID of the migration, the migration is

discarded.

One weakness of this model is that it is vulnerable if a new update starts

before another update is promulgated to all live nodes--only one migration can

be active within a cluster at any time. One way to get around this is to choose

one node and only initiate migrations through it.

写入的节点是有重叠的。在一个RDBMS的复制模型中（Master/salve)，假如N=2,那么

W=2,R=1此时是一种强一致性,但是这样造成的问题就是可用性的减低，因为要想写操作成

功，必须要等 2个节点都完成以后才可以。

在分布式系统中，一般都要有容错性，因此一般N都是大于3的，此时根据CAP理论，一致

性，可用性和分区容错性最多只能满足两个，那么我们就需要在一致性和分区容错性之间

做一平衡，如果要高的一致性，那么就配置N=W，R=1,这个时候可用性就会大大降低。如

果想要高的可用性，那么此时就需要放松一致性的要求，此时可以配置W=1，这样使得写

操作延迟最低，同时通过异步的机制更新剩余的N-W个节点。

当存储系统保证最终一致性时，存储系统的配置一般是W+R<=N,此时读取和写入操作是不

重叠的，

不一致性的窗口就依赖于存储系统的异步实现方式，不一致性的窗口大小也就等于从更新

开始到所有的节点都异步更新完成之间的时间。

(N,R,W) 的值典型设置为 (3, 2 ,2),兼顾性能与可用性。R 和 W 直接影响性能、扩展性、

一致性，如果 W 设置为 1，则一个实例中只要有一个节点可用，也不会影响写操作，如

果 R 设置为 1 ，只要有一个节点可用，也不会影响读请求，R 和 W 值过小则影响一致

性，过大也不好，这两个值要平衡。对于这套系统的典型的 SLA 要求 99.9% 的读写操作

在 300ms 内完成。

无论是Read-your-writes-consistency,Session consistency,Monotonic read consistency,它

们都通过黏贴（stickiness)客户端到执行分布式请求的服务器端来实现的，这种方式简单是

简单，但是它使得负载均衡以及分区容错变的更加难于管理，有时候也可以通过客户端来

实现Read-yourwrites-consistency和Monotonic read consistency,此时需要对写的操作的数据加

版本号，这样客户端就可以遗弃版本号小于最近看到的版本号的数据。

在系统开发过程中，根据CAP理论，可用性和一致性在一个大型分区容错的系统中只能满

足一个，因此为了高可用性，我们必须放低一致性的要求，但是不同的系统保证的一致性

还是有差别的，这就要求开发者要清楚自己用的系统提供什么样子的最终一致性的保证，

一个非常流行的例子就是web应用系统，在大多数的web应用系统中都有“用户可感知一致

性”的概念，这也就是说最终一致性中的“一致性窗口"大小要小于用户下一次的请求，在下

次读取操作来之前，数据可以在存储的各个节点之间复制。

还比如假如存储系统提供了read-your-write-consistency一致性，那么当一个用户写操作完成

以后可以立马看到自己的更新，但是其它的用户要过一会才可以看到更新。

几种特殊情况：

W = 1, R = N,对写操作要求高性能高可用。

R = 1, W = N , 对读操作要求高性能高可用，比如类似cache之类业务。

W = Q, R = Q where Q = N / 2 + 1 一般应用适用，读写性能之间取得平衡。如 N=3,W=2,R=2

表决方式来提升一致性。

N——副本个数，N 为配置的 ReplicationFactor

W——每次保证写入的个数，W 的选取：

输入：naturalTargets，即 N；hintedTargets，备选集合总数，包含了故障节点的备份点；

ConsistencyLevel，一致性级别

bootstrapTargets 为 hintedTargets 和 naturalTargets 的差值，

如果级别为 ConsistencyLevel.ANY，W 等于 1

剩余100页未读，继续阅读

weishiym

粉丝: 27
资源: 9

Cassandra分布式数据库深度解析：模型与源代码探索

Cassandra的环境配置与启动实验收获

各类分布式计算的区别与联系

有哪些分布式数据库系统

使用分布式uuid来标识cassandra数据库的值

Apache Cassandra

大数据分布式计算相关框架有哪些

分布式数据库原理与应用实验收获

大数据分布式计算的组件

什么是分布式系统？请举例一些常用的分布式系统技术，如MapReduce、Hadoop等

python如何通过cassandra cluster插入大批量数据到cassandra表中

最新资源