Elasticsearch数据安全：如何确保数据不丢失的机制解析

需积分: 0 61 浏览量更新于2024-08-05 收藏 253KB PDF 举报

"本文主要探讨了Elasticsearch如何确保数据在异常情况下的完整性，特别是通过transaction log（translog）机制来防止数据丢失。" 在Elasticsearch中，数据的持久化是一个关键问题，特别是在面对系统崩溃或意外断电时。为了解决这个问题，Elasticsearch引入了transaction log（交易日志）机制，类似于Hadoop的editslog和HBase的WALlog，用于记录每一个数据操作。以下是translog的工作流程和Elasticsearch如何保证数据不丢失的详细过程： 1. **数据索引**：当一个文档被索引时，它首先会被放入内存buffer，并同时在translog中记录。这样，即使数据尚未被刷新到磁盘，也已经在translog中有备份。 2. **refresh操作**：每个shard每隔一秒进行一次refresh，将内存buffer中的数据写入新的segment。然而，refresh后，内存buffer会被清空，但translog中的记录仍然保留。 3. **数据增长与translog累积**：随着更多文档被添加，内存buffer不断被刷新和清空，translog记录不断增加。此时，数据可以被搜索，但未被持久化到磁盘。 4. **flush操作**：当达到默认的30分钟或者translog达到一定大小时，会触发flush操作。这是一个完整的提交过程，包括以下步骤： - **生成新segment**：内存buffer中的所有文档被写入一个新的segment。 - **refresh到cache**：新segment被刷新到系统缓存，此时数据对搜索可见，但内存buffer被清空。 - **commitpoint**：commitpoint（即当前的segment列表）被写入磁盘，标记数据已持久化。 - **flush cache**：通过fsync操作，filesystem cache被强制刷到磁盘，确保数据安全。 - **创建新的translog**：旧的translog关闭，新的translog开始记录后续的操作。通过这个机制，Elasticsearch能够在系统崩溃后，根据translog中的记录重新执行未持久化的操作，从而恢复数据。即使在长时间未刷新到磁盘的情况下，也能保证在故障发生后，通过translog回放数据，减少可能的数据丢失。 Elasticsearch通过高效的refresh和flush策略，结合transaction log，实现了对数据的实时性和持久性的平衡。在提高搜索性能的同时，确保了在异常情况下的数据安全性。

Elasticsearch如何保证数据不丢失？

上篇⽂章提到过，在elasticsearch和磁盘之间还有⼀层cache也就是ﬁlesystem

cache，⼤部分新增或者修改，删除的数据都在这层cache中，如果没有ﬂush

操作，那么就不能100%保证系统的数据不会丢失，⽐如突然断电或者机器

宕机了，但实际情况是es中默认是30分钟才ﬂush⼀次磁盘，这么长的时间

内，如果发⽣不可控的故障，那么是不是必定会丢失数据呢？

很显然es的设计者早就考虑了这个问题，在两次full commit操作（ﬂush）之

间，如果发⽣故障也不能丢失数据，那么es是如何做到的呢？

在es⾥⾯引⼊了transaction log（简称translog），这个log的作⽤就是每条数

据的任何操作都会被记录到该log中，⾮常像Hadoop⾥⾯的edits log和hbase

⾥⾯的WAL log，如下图：

transaction log的⼯作流程如下：

（1）当⼀个⽂档被索引时，它会被添加到内存buffer⾥⾯同时也会在

translog⾥⾯追加

下载后可阅读完整内容，剩余4页未读，立即下载

玛卡库克

粉丝: 35
资源: 309

Elasticsearch数据安全：如何确保数据不丢失的机制解析

mysql数据导入elasticsearch并支持SQL查询

es迁移工具，实现es数据的两个集群之间或者导出到本地进行迁移.zip

数据持久性揭秘：Elasticsearch 的数据恢复是如何工作的？

Elasticsearch数据备份迁移工具elasticsearch-dump 6.78.0发布

Elasticsearch2.0.0数据备份与恢复简易工具elasticdump

Elasticsearch的数据备份与恢复

elasticsearch的数据备份与恢复策略

Elasticsearch的数据备份与恢复策略

使用elasticsearch进行数据索引与搜索

Elasticsearch 数据备份和恢复

最新资源