Elasticsearch原理探索:_score计算与应用
需积分: 20 118 浏览量
更新于2024-08-13
收藏 1.01MB PPT 举报
本文主要解析了Elasticsearch中 `_score` 的计算原理,并介绍了Elasticsearch作为分布式搜索引擎的核心特点和应用场景。
在Elasticsearch中,`_score` 是每个文档在搜索结果中的相关性评分,它是如何计算出来的呢?首先,我们需要了解Elasticsearch的两大索引类型:倒排索引和正排索引(doc values)。倒排索引用于快速搜索,而正排索引用于排序、聚合和过滤等操作。
倒排索引是Elasticsearch搜索的基础,它将文档中的词汇映射到包含这些词汇的文档列表。例如,对于文档"hello world you and me"和"hi, world, how are you",倒排索引会创建"hello"对应doc1,"world"对应doc1和doc2,"you"对应doc1和doc2等关系。
正排索引(doc values)则保存了每个字段的值,以便于排序和过滤。当内存不足时,操作系统会将这些数据写回磁盘。在上述示例中,按"age"字段排序时,不能使用倒排索引,因为倒排索引无法提供数值排序,而是需要doc values。
Elasticsearch不仅仅是一个基于Lucene的全文搜索引擎,它是一个分布式、实时的存储和分析平台,能够处理大量结构化和非结构化数据。它具有以下特性:
1. 分布式实时文件存储:数据被分散存储在集群的不同节点上,支持高可用性和水平扩展。
2. 实时分析搜索引擎:能够快速响应查询,同时支持数据分析。
3. 可扩展性:能够扩展到数百台服务器,处理PB级别的数据。
Elasticsearch广泛应用于各种场景,如StackOverflow的搜索功能,GitHub的代码搜索,以及电子商务网站的商品搜索等。其功能涵盖:
1. 分布式搜索引擎和数据分析引擎:既能处理搜索需求,也能进行复杂的数据分析。
2. 全文检索和结构化检索:支持对文本和结构化数据的查询。
3. 数据分析:可以对大量数据进行聚合和统计分析。
在全文检索中,用户可以通过关键词如"牙膏"来搜索包含该词的商品。而在结构化检索中,可以指定特定条件,如查找商品分类为"日化用品"的所有商品。Elasticsearch通过其强大的索引和搜索机制,使得这些操作变得高效且易于实现。
104 浏览量
点击了解资源详情
点击了解资源详情
233 浏览量
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
冀北老许
- 粉丝: 19
- 资源: 2万+
最新资源
- 上海大众供应商物流与采购过程分析规则
- ubs-for-uta-6324:适用于utaSpring2021的ubs系统adv sse 6324课程
- Open Source on the Xbox 360:xbox360 游戏机上的 UNIX/LINUX 和合法自制软件-开源
- 里科米达
- Sarkari Job-crx插件
- ShengSanYi-ArduinoEsp8266-master.zip
- domocracy:Domocracy 的开源工具
- 设施规划与物流分析PDF
- COMPENG-2DX4:该存储库保存了我的2021年冬季微处理器系统项目课程中所用的代码,在该课程中,我学习了如何对ARM MSP-EXP432微控制器进行编程。 我在各种外围设备(包括电机和键盘)上使用了ARM-Assembly,ARM-C和Python,所有这些都构成了构建LIDAR映射传感器的最终项目
- biningo
- project-flyer:我的克隆项目传单
- jquery.page分页控件02.zip
- 4EnRaya:我首先通过控制台在三个版本中连续玩四个,然后是摇摆,最后是在线
- ShopOnline.DotNetCore3:ShopOnline.DotNetCore3
- 图形化-班级成绩管理系统.zip
- CSCI370-Lab_04:异步任务