Elasticsearch分片规则深度解析：源码探索

需积分: 48 12 浏览量更新于2024-08-18 收藏 810KB PPT 举报

"这篇资源主要探讨了Elasticsearch（ES）中的分片（Shard）规则，以及如何通过源码分析来理解分片的工作机制。文章以创建索引、删除索引、更新索引等操作为例，展示了ES的RESTful API使用，并提到了JSON序列化库Jackson的使用。此外，还提及了DFS查询的概念和初始化散发的过程。" 在Elasticsearch中，分片是其分布式特性的核心组件，允许数据分散存储在多个节点上，从而实现水平扩展和高可用性。当我们创建一个索引时，每个文档都会被分配到特定的分片上。这个过程基于 PlainOperationRouting 类的 shardId 方法，通过对文档的_id或_id和类型进行哈希计算，然后用哈希值除以索引的分片总数取余，得到的余数就是文档将被存储的分片编号。例如，假设我们有一个索引`crxy`，其中包含一个名为`emp`的类型，且`emp`类型的_id为`21`的文档。在执行以下操作： ```json { "index": { "_index": "crxy", "_type": "emp", "_id": "21" } } { "name": "test21" } ``` ES会使用_id字段的哈希值，按照上述规则确定文档所在的分片。同时，文中提到了JSON序列化，这是在与ES交互时常见的数据转换方式。Jackson库（如依赖项所示）可以帮助我们将Java对象转换为JSON字符串，以便通过HTTP请求发送给ES，如： ```java ObjectMapper mapper = new ObjectMapper(); String json = mapper.writeValueAsString(yourBeanInstance); ``` 另外，文章还提到了DFS查询，全称为“Distributed Frequency Search”，它涉及Elasticsearch的查询优化策略。DFS在查询之前先收集所有分片的词频率和文档频率，以提高后续的搜索性能。初始化散发正是这个过程的一部分，它在实际查询前先执行，确保有足够信息进行有效的查询和排序。这篇文章深入解析了Elasticsearch中的分片策略，以及与其相关的REST API使用和DFS查询概念，对于理解ES的内部工作原理和优化查询性能非常有帮助。

条之

粉丝: 27
资源: 2万+

Elasticsearch分片规则深度解析：源码探索

windows最新版 elasticsearch-7.0.0-windows-x86_64.zip

分布式搜索 elasticsearch 方案研究 - 基础知识

elasticsearch-oss-7.10.2-linux-x86_64.tar.gz

Elasticsearch-Data-Test:测试 Elasticsearch 的数据存储和访问时间，以便与 CoGe 一起使用

source-code-ns-elasticsearch-master.zip

ElasticSearch Head-0.1.5_0.zip

ES1-源码.rar

elasticsearch-1.0.zip

elasticsearch-5.3.2.zip

elasticsearch-5.6.3.zip

最新资源