Elasticsearch分片规则深度解析:源码探索
需积分: 48 54 浏览量
更新于2024-08-18
收藏 810KB PPT 举报
"这篇资源主要探讨了Elasticsearch(ES)中的分片(Shard)规则,以及如何通过源码分析来理解分片的工作机制。文章以创建索引、删除索引、更新索引等操作为例,展示了ES的RESTful API使用,并提到了JSON序列化库Jackson的使用。此外,还提及了DFS查询的概念和初始化散发的过程。"
在Elasticsearch中,分片是其分布式特性的核心组件,允许数据分散存储在多个节点上,从而实现水平扩展和高可用性。当我们创建一个索引时,每个文档都会被分配到特定的分片上。这个过程基于 PlainOperationRouting 类的 shardId 方法,通过对文档的_id或_id和类型进行哈希计算,然后用哈希值除以索引的分片总数取余,得到的余数就是文档将被存储的分片编号。
例如,假设我们有一个索引`crxy`,其中包含一个名为`emp`的类型,且`emp`类型的_id为`21`的文档。在执行以下操作:
```json
{
"index": {
"_index": "crxy",
"_type": "emp",
"_id": "21"
}
}
{
"name": "test21"
}
```
ES会使用_id字段的哈希值,按照上述规则确定文档所在的分片。
同时,文中提到了JSON序列化,这是在与ES交互时常见的数据转换方式。Jackson库(如依赖项所示)可以帮助我们将Java对象转换为JSON字符串,以便通过HTTP请求发送给ES,如:
```java
ObjectMapper mapper = new ObjectMapper();
String json = mapper.writeValueAsString(yourBeanInstance);
```
另外,文章还提到了DFS查询,全称为“Distributed Frequency Search”,它涉及Elasticsearch的查询优化策略。DFS在查询之前先收集所有分片的词频率和文档频率,以提高后续的搜索性能。初始化散发正是这个过程的一部分,它在实际查询前先执行,确保有足够信息进行有效的查询和排序。
这篇文章深入解析了Elasticsearch中的分片策略,以及与其相关的REST API使用和DFS查询概念,对于理解ES的内部工作原理和优化查询性能非常有帮助。
2022-04-28 上传
216 浏览量
2023-07-25 上传
2021-06-23 上传
2021-06-30 上传
2022-05-21 上传
2021-10-10 上传
2020-02-07 上传
2020-07-07 上传
条之
- 粉丝: 24
- 资源: 2万+
最新资源
- 正整数数组验证库:确保值符合正整数规则
- 系统移植工具集:镜像、工具链及其他必备软件包
- 掌握JavaScript加密技术:客户端加密核心要点
- AWS环境下Java应用的构建与优化指南
- Grav插件动态调整上传图像大小提高性能
- InversifyJS示例应用:演示OOP与依赖注入
- Laravel与Workerman构建PHP WebSocket即时通讯解决方案
- 前端开发利器:SPRjs快速粘合JavaScript文件脚本
- Windows平台RNNoise演示及编译方法说明
- GitHub Action实现站点自动化部署到网格环境
- Delphi实现磁盘容量检测与柱状图展示
- 亲测可用的简易微信抽奖小程序源码分享
- 如何利用JD抢单助手提升秒杀成功率
- 快速部署WordPress:使用Docker和generator-docker-wordpress
- 探索多功能计算器:日志记录与数据转换能力
- WearableSensing: 使用Java连接Zephyr Bioharness数据到服务器