实战分享：30道Elasticsearch面试难题及调优策略

需积分: 2 80 浏览量更新于2024-08-04 收藏 2.15MB PDF 举报

在Elasticsearch面试中，面试官通常会考察应聘者的理解和实践经验。以下是关于Elasticsearch的一些核心知识点： 1. 集群架构与索引管理：应聘者需阐述自己公司的Elasticsearch集群配置，包括节点数量（如13个节点）、索引数量和分布（20+索引，每日新增），以及分片策略（每个索引10个分片，每天增加1亿+数据）。此外，他们还会询问索引设计的规划和调优手段，如利用日期模板创建索引、rollover API滚动索引、别名管理、force_merge操作、冷热数据分离（SSD和shrink操作）、Curator的索引生命周期管理、以及合理设置分词器和字段属性。 2. 写入优化：面试者应熟悉如何在写入时优化性能，例如设置写入前副本数为0、关闭refresh_interval以减少刷新，采用bulk批量写入，以及恢复写入后的副本数和刷新间隔。同时，使用自动生成的ID也是写入过程中的最佳实践。 3. 查询优化：面试者需要展示对倒排索引的理解，即通过词典和映射表实现快速检索，避免使用wildcard和批量terms查询，优先使用keyword类型，以及根据数据量大小和时间范围进行索引选择。路由机制的合理设置也非常重要。 4. 基础概念理解：倒排索引是一种技术，它通过将文档中的词语映射到一个索引表中，使得搜索时能够迅速定位包含特定词的文档，显著提高了搜索效率。面试者需要用通俗易懂的方式解释这一概念，同时给出学术层面的定义。 5. 其他调优：面试官还会关注部署、业务层面的调优，如监控系统、性能瓶颈分析、索引和文档级别的优化，以及如何根据业务需求调整Elasticsearch的配置。在面试中，应聘者需要展现出对Elasticsearch的深入理解和实践经验，包括如何根据实际需求设计和优化索引结构，以及如何在性能和可用性之间取得平衡。同时，对于基础概念的掌握和实际问题的解决能力，都是评估候选人的重要指标。

lucene 从 4+版本后开始大量使用的数据结构是 FST。FST 有两个优点：

（1）空间占用小。通过对词典中单词前缀和后缀的重复利用，压缩了存储空间；

（2）查询速度快。O(len(str))的查询时间复杂度。

3、elasticsearch 索引数据多了怎么办，如何调优，部署

面试官：想了解大数据量的运维能力。

解答：索引数据的规划，应在前期做好规划，正所谓“设计先行，编码在后”，这样才能有效的避免突如

其来的数据激增导致集群处理能力不足引发的线上客户检索或者其他业务受到影响。

如何调优，正如问题 1 所说，这里细化一下：

3.1 动态索引层面

基于模板+时间+rollover api 滚动创建索引，举例：设计阶段定义：blog 索引的模板格式为：

blog_index_时间戳的形式，每天递增数据。这样做的好处：不至于数据量激增导致单个索引数据量非

常大，接近于上线 2 的32 次幂-1，索引存储达到了 TB+甚至更大。

一旦单个索引很大，存储等各种风险也随之而来，所以要提前考虑+及早避免。

3.2 存储层面

冷热数据分离存储，热数据（比如最近 3 天或者一周的数据），其余为冷数据。

对于冷数据不会再写入新数据，可以考虑定期 force_merge 加 shrink 压缩操作，节省存储空间和检索

效率。

3.3 部署层面

一旦之前没有规划，这里就属于应急策略。

结合 ES 自身的支持动态扩展的特点，动态新增机器的方式可以缓解集群压力，注意：如果之前主节点

等规划合理，不需要重启集群也能完成动态新增的。

4、elasticsearch 是如何实现 master 选举的

面试官：想了解 ES 集群的底层原理，不再只关注业务层面了。

解答：

前置前提：

（1）只有候选主节点（master：true）的节点才能成为主节点。

（2）最小主节点数（min_master_nodes）的目的是防止脑裂。

核对了一下代码，核心入口为 ﬁndMaster，选择主节点成功返回对应 Master，否则返回 null。选举流

程大致描述如下：

第一步：确认候选主节点数达标，elasticsearch.yml 设置的值

discovery.zen.minimum_master_nodes；

第二步：比较：先判定是否具备 master 资格，具备候选主节点资格的优先返回；

若两节点都为候选主节点，则 id 小的值会主节点。注意这里的 id 为 string 类型。

题外话：获取节点 id 的方法。

微信公众号：Java架构师进阶编程

剩余12页未读，继续阅读

丶张豪哥

粉丝: 49
资源: 50

实战分享：30道Elasticsearch面试难题及调优策略

ElasticSearch面试题 30道1

ElasticSearch面试题 30道.pdf

ElasticSearch面试题 30道，面试通关秘籍

ElasticSearch面试题

2024年java面试题-ElasticSearch面试题集

ElasticSearch面试题.pdf

elasticsearch面试题

elastic search面试题

Elasticsearch面试题

最新资源