ES入门:实时搜索与倒排索引详解
需积分: 10 38 浏览量
更新于2024-07-19
收藏 2.36MB PPTX 举报
ES入门与探索.pptx是一份针对Elasticsearch(ES)的详细介绍文档,主要关注于ES作为一款分布式搜索和分析引擎的基础概念、安装配置、核心功能以及与关系型数据库的区别。以下是关键知识点的详细解读:
1. **Elasticsearch简介**:
- Elasticsearch并非传统的数据库,而是专为实时搜索和数据分析设计的搜索引擎,尤其适用于大数据场景。
- 它基于5.1版本,强调了其近实时(NRT)特性,即索引新文档后能快速被搜索,延迟时间默认为1秒。
2. **与传统数据库对比**:
- Elasticsearch采用倒排索引技术,每个文档中的单词都会被索引,使得全文检索更为高效。与关系型数据库不同,后者通常每个字段存储单一值,而ES支持多值索引。
- ES的设计理念是以索引为核心,所有操作都是围绕搜索进行,而非像关系型数据库那样强调关系和联系。
3. **安装与依赖**:
- 文档并未详述安装步骤,但强调了设置静态或动态索引参数时需谨慎,因为修改已关闭的索引可能导致不可逆的问题,可能需要重新创建索引。
4. **API使用**:
- Elasticsearch通过REST API提供服务,使用HTTP协议并通过JSON格式进行通信。API包括Index Settings API用于管理索引设置,如调整分片(shards)和副本(replicas)数量,以及Indices API,如PUT方法用于修改特定索引的配置。
5. **Index Settings**:
- 操作索引设置时,需要理解其潜在影响,例如改变一个关闭的索引的设置可能导致无法修复的问题,此时可能需要删除并重建索引。
6. **索引操作**:
- 使用PUT请求可以修改如`twitter`索引的设置,指定特定的`index_number_of_shards`和`index_number_of_replicas`等参数,同时涉及删除和添加别名的操作,如使用POST请求对`_aliases`执行动作。
这份文档旨在帮助读者快速理解Elasticsearch的基本概念,掌握其在搜索和大数据分析中的应用,并学会如何有效地管理索引设置和API调用。对于想要深入学习和使用ES的开发者或技术人员来说,它提供了一个良好的起点。
2020-04-14 上传