首页cassandra 空表为什么会布隆误判

cassandra 空表为什么会布隆误判

时间: 2023-10-28 08:06:07 浏览: 140

cassandra-exporter:将导入 Cassandra 表导出为 JSON 的简单工具

卡桑德拉出口商 Cassandra exporter 是 cassandra 的数据导出/导入工具，它使用简单，适用于 unicode 和复杂数据类型。它是用 Javascript 开发的，导出的数据存储在 JSON 格式的文件中。为什么是另一个工具？ Cassandra 有一些很棒的工具可以导出和导入数据：快照 sstable2json CQL 的 COPY FROM/TO 但问题是快照和 sstable2json 并不是那么容易使用。它们旨在移动大型数据集，对我来说，在日常开发中使用起来不必要地复杂。 COPY 命令旨在用于开发或移动小型数据集，但并不可靠。因为它使用 csv 导出，如果您尝试导入该数据，它会破坏复杂的数据类型和非 ascii 编码。因此，出于开发目的和移动小型数据集（每个表<几百万行），我需要一些功能强大且易于使用的东西。下载您可以从部分下载

Cassandra使用布隆过滤器来确定一个给定的键是否在一个SSTable中。当一个表是空的时候，布隆过滤器会被初始化为一个全零的数组，这就导致了误判的情况。当布隆过滤器的数组全部为0时，它会认为所有的键都不存在于表中，因此在查询时会误判为“不存在”，即使这个键实际上存在于表中。这种情况下，可以通过增加布隆过滤器的大小来减少误判率，或者在表中插入一些数据来初始化布隆过滤器。

阅读全文