Elasticsearch存储与管理优化策略详解

需积分: 0 81 浏览量更新于2024-08-05 收藏 110KB PDF 举报

Elasticsearch 存储方式和管理优化细节1 在Elasticsearch中，数据的存储主要依赖于Lucene引擎，其核心概念包括段(segment)和倒排索引。当文档被写入时，Lucene会生成一个新的段并将其写入内存缓冲区（刷新到buffer）。同时，一个translog日志也被记录，用于跟踪数据的持久化过程。默认情况下，Elasticsearch会在30分钟内自动执行flush操作，将内存中的更改永久写入磁盘，并更新commit文件。 5.0版本引入了新的灵活性，允许用户通过`refresh=wait_for`参数控制刷新行为。对于实时性要求高的场景，可以选择等待刷新完成再返回结果，如`refresh_interval`设置为10秒。而对于非实时或归档导入的情况，可以临时禁用刷新，导入后再手动刷新。为了减少系统开销，Elasticsearch在5.0之后采用了Lucene的Concurrent Merge Scheduler (CMS)自动合并小的段。默认的合并限制设置为单次最大合并大小为10240MB，可以通过`indices.store.throttle.max_bytes_per_sec`进行调整。归并线程数量建议保持默认值，即3个线程。归并策略方面，Elasticsearch提供了几个关键参数来优化段的合并过程。`index.merge.policy.floor_segment`设置为2MB，意味着小于此阈值的段会被优先合并。`index.merge.policy.max_merge_at_once`限制了一次合并的最大段数，正常情况下是10个，而在forcemerge操作时，可以调整为最多合并30个segment。此外，监控Elasticsearch集群的健康状况至关重要，通过定期执行监控任务检查节点状态、性能指标以及索引的活跃程度，确保数据的可靠性和系统的稳定性。持续的维护和调整这些参数有助于提升Elasticsearch的性能，使其更好地适应不同场景的需求。 Elasticsearch的存储管理和优化涉及到多个层面，包括数据写入策略、内存缓冲与磁盘持久化的协同、自动合并机制、以及对归并策略的精细调整。理解和掌握这些细节有助于提高系统的效率和可用性。

Elasticsearch 存储⽅式和管理优化细

节

Elasticsearch 的数据存储⽅式：

Lucene 把每次⽣成的倒排索引，叫做⼀个段(segment).然后另外使⽤⼀个

commit ⽂件记录索引内所有的 segment，⽣成 segment 的数据来源，refresh

到内存中的 buffer。

从写⼊refresh到⽂件缓存buffer中默认设置为 1 秒。

Elasticsearch 在把数据写⼊到内存 buffer 的同时，其实还另外记录了⼀个

translog ⽇志。通过translog ⽇志真正把 segment 刷到磁盘，同时commit ⽂

件进⾏更新，然后translog ⽂件才清空。这

⼀步，叫做 ﬂush。默认设置为：每 30 分钟主动进⾏⼀次 ﬂush。

上述两个过程保证数据实时查询和持久化数据。

注：5.0 中还提供了⼀个新的请求参数：?refresh=wait_for，可以在写⼊数据

后不强制刷新但⼀直等到刷新才返回。对于⽇志记录，可以等到时间缓冲后

再刷新，不需要保证实时，"refresh_interval":

"10s"；对于归档的数据导⼊时，可以先设置"refresh_interval": "-1"关闭刷

新，导⼊完后⼿动刷新即可。

注：为了减⼩系统开销，⼩的segment归并成⼤的segment再提交保存。

segment 归并的过程，需要先读取 segment，归并计算，再写⼀遍 segment，

最后还要保证刷到磁盘。5.0后引⼊Lucene的CMS⾃动调

整机制，默认设置是 10240 MB；封装

了"indices.store.throttle.max_bytes_per_sec" 该配置，不需要再设置。归并线

程保持默认即可。index.merge.scheduler.max_thread_count=3

归并策略优化：

下载后可阅读完整内容，剩余4页未读，立即下载

小崔个人精进录

粉丝: 39
资源: 316

Elasticsearch存储与管理优化策略详解

elasticsearch7.14.0.zip

elasticsearch-7.10.2.zip

koa-elasticsearch：koa，elasticsearch

elasticsearch - 搜索引擎 - elasticsearch tutorial

elasticsearch集群

Elasticsearch Blueprints

ElasticSearch 全文搜索引擎；从0到1教你学会ES 搜索引擎

elasticsearch-client-rest:org.elasticsearch.client.rest官方代码修改，官方版本要求JDK版本最低为1.7，修改优化为支持JDK1.6-修改

Elasticsearch基础设置与性能优化技巧

Lucene与ES面试攻略：倒排索引与Elasticsearch写入优化详解

最新资源