Cassandra分布式模型详解与源码洞察

需积分: 0 10 浏览量更新于2024-07-31 收藏 1.77MB DOCX 举报

Cassandra分布式模型与源代码分析深入探讨了这个高效且灵活的NoSQL数据库系统。Cassandra由Facebook开发并广泛应用于如Twitter、Facebook这样的大型企业，用于处理海量数据。其核心特点是分布式、基于列的结构化存储和高伸缩性。首先，Cassandra的分布式模型是其关键优势之一。它采用了一种分布式网络服务架构，数据被分散存储在多个节点上，通过一致性哈希算法实现数据的负载均衡和故障容错。每个写入操作不仅写入主节点，还会复制到其他节点，确保冗余备份，而读取则通过节点间的路由机制找到相应的数据。这种设计使得Cassandra能够避免单点故障，提升系统的可靠性。其次，Cassandra的灵活性体现在其schema设计上。它支持on-the-fly schema变更，即用户无需在创建表之前预设固定的字段，可以根据实际需求动态添加或删除，这极大地方便了开发者和数据模型的管理。高可用性和可扩展性也是Cassandra的重要特性。当需要增加存储容量时，只需要向集群中添加新节点，无需停机或改变应用程序。这种纯粹的水平扩展方式允许Cassandra轻松应对不断增长的数据量，同时保证服务的连续性。 Cassandra还支持范围查询，这对于处理时间序列数据或者地理位置信息尤其有用，只需设置特定的键范围，即可获取相关的数据集合。此外，它提供了列表数据结构，能够在混合模式下处理复杂的多维度数据，例如将超级列添加到四维或五维的Hash中。源代码分析方面，Cassandra的设计注重一致性与分区容错，它的Paxos和Raft协议在确保分布式一致性的同时，也实现了高效的节点间通信和数据同步。Cassandra的核心组件包括 SSTable、Memtable、Ring gossip 等，这些都反映在源码中，为理解和优化其性能提供了重要的依据。应用层面上，Cassandra常用于存储和查询大规模、实时更新的数据，比如日志、用户行为数据、社交网络数据等。其分布式特性和高效的数据模型使得Cassandra在处理大规模数据挑战时表现出色。 Cassandra分布式模型的精髓在于其分布式网络服务、灵活的schema、范围查询能力以及高度的可扩展性，这些特性使其成为现代大数据场景中的重要选择。源代码分析则有助于深入理解其内部工作机制，以优化部署和使用效果。

2.8.5.7Existing Cluster (Upgrade from 0.6)

To provide some backwards compatibility, we've provided a JMX method in

the StorageServiceMBean that can be used to manually load schema definitions

from storage-conf.xml. This is a one-shot operation though, and will only work

on a system that contains no existing migrations. If you are upgrading a cluster,

you will probably only have to do this for one node (a seed). Gossip will take

care of promulgating the changes to the rest of the nodes as they come online.

For those who dont know how to do it (like me):

ps aux | grep cassandra # get pid of cassandra

jconsole PID

MBeans -> org.apache.cassandra.service -> StorageService -> Operations ->

loadSchemaFromYAML

2.8.5.8Concurrency

It is entirely possible and expected that a node will receive migration pushes

from multiple nodes. Because of this, all migrations are applied on a

single-threaded stage and versions are checked throughout to make sure that

no migration is applied twice, and no migration is applied out of sync.

Each migration knows the version UUID of the migration that immediately

precedes it. If a node is asked to apply a migration and its current version

UUID does not match the last version UUID of the migration, the migration is

discarded.

One weakness of this model is that it is vulnerable if a new update starts

before another update is promulgated to all live nodes--only one migration can

be active within a cluster at any time. One way to get around this is to choose

one node and only initiate migrations through it.

写入的节点是有重叠的。在一个RDBMS的复制模型中（Master/salve)，假如N=2,那么

W=2,R=1此时是一种强一致性,但是这样造成的问题就是可用性的减低，因为要想写操作成

功，必须要等 2个节点都完成以后才可以。

在分布式系统中，一般都要有容错性，因此一般N都是大于3的，此时根据CAP理论，一致

性，可用性和分区容错性最多只能满足两个，那么我们就需要在一致性和分区容错性之间

做一平衡，如果要高的一致性，那么就配置N=W，R=1,这个时候可用性就会大大降低。如

果想要高的可用性，那么此时就需要放松一致性的要求，此时可以配置W=1，这样使得写

操作延迟最低，同时通过异步的机制更新剩余的N-W个节点。

当存储系统保证最终一致性时，存储系统的配置一般是W+R<=N,此时读取和写入操作是不

重叠的，

不一致性的窗口就依赖于存储系统的异步实现方式，不一致性的窗口大小也就等于从更新

开始到所有的节点都异步更新完成之间的时间。

(N,R,W) 的值典型设置为 (3, 2 ,2),兼顾性能与可用性。R 和 W 直接影响性能、扩展性、

一致性，如果 W 设置为 1，则一个实例中只要有一个节点可用，也不会影响写操作，如

果 R 设置为 1 ，只要有一个节点可用，也不会影响读请求，R 和 W 值过小则影响一致

性，过大也不好，这两个值要平衡。对于这套系统的典型的 SLA 要求 99.9% 的读写操作

在 300ms 内完成。

无论是Read-your-writes-consistency,Session consistency,Monotonic read consistency,它

们都通过黏贴（stickiness)客户端到执行分布式请求的服务器端来实现的，这种方式简单是

简单，但是它使得负载均衡以及分区容错变的更加难于管理，有时候也可以通过客户端来

实现Read-yourwrites-consistency和Monotonic read consistency,此时需要对写的操作的数据加

版本号，这样客户端就可以遗弃版本号小于最近看到的版本号的数据。

在系统开发过程中，根据CAP理论，可用性和一致性在一个大型分区容错的系统中只能满

足一个，因此为了高可用性，我们必须放低一致性的要求，但是不同的系统保证的一致性

还是有差别的，这就要求开发者要清楚自己用的系统提供什么样子的最终一致性的保证，

一个非常流行的例子就是web应用系统，在大多数的web应用系统中都有“用户可感知一致

性”的概念，这也就是说最终一致性中的“一致性窗口"大小要小于用户下一次的请求，在下

次读取操作来之前，数据可以在存储的各个节点之间复制。

还比如假如存储系统提供了read-your-write-consistency一致性，那么当一个用户写操作完成

以后可以立马看到自己的更新，但是其它的用户要过一会才可以看到更新。

几种特殊情况：

W = 1, R = N,对写操作要求高性能高可用。

R = 1, W = N , 对读操作要求高性能高可用，比如类似cache之类业务。

W = Q, R = Q where Q = N / 2 + 1 一般应用适用，读写性能之间取得平衡。如 N=3,W=2,R=2

表决方式来提升一致性。

N——副本个数，N 为配置的 ReplicationFactor

W——每次保证写入的个数，W 的选取：

输入：naturalTargets，即 N；hintedTargets，备选集合总数，包含了故障节点的备份点；

ConsistencyLevel，一致性级别

bootstrapTargets 为 hintedTargets 和 naturalTargets 的差值，

如果级别为 ConsistencyLevel.ANY，W 等于 1

剩余100页未读，继续阅读

sxz20041919

粉丝: 3
资源: 12

Cassandra分布式模型详解与源码洞察

Cassandra的环境配置与启动实验收获

各类分布式计算的区别与联系

有哪些分布式数据库系统

使用分布式uuid来标识cassandra数据库的值

Apache Cassandra

大数据分布式计算相关框架有哪些

分布式数据库原理与应用实验收获

大数据分布式计算的组件

什么是分布式系统？请举例一些常用的分布式系统技术，如MapReduce、Hadoop等

python如何通过cassandra cluster插入大批量数据到cassandra表中

最新资源