Elasticsearch 数据聚合实战：统计与分析

需积分: 0 132 浏览量更新于2024-06-21 收藏 3.72MB PDF 举报

"Elasticsearch 分布式搜索引擎与数据聚合" 在深入了解 Elasticsearch (ES) 的过程中，数据聚合（aggregations）是一个至关重要的概念。它允许我们高效地对存储的数据进行统计、分析和运算，无需依赖传统的 SQL 查询，且能实现近实时的搜索效果。在 Elasticsearch 中，聚合主要分为三类： 1. 桶（Bucket）聚合：这种聚合用于将文档分组，从而可以对特定类别进行分析。例如，TermAggregation 是根据文档字段的值进行分组，这可以用于按照品牌或国家等分类；DateHistogram 则是按照时间间隔（如每周或每月）进行分组，适用于查看销售趋势。 2. 度量（Metric）聚合：这类聚合用于计算各种统计值，如 Avg（平均值）、Max（最大值）、Min（最小值）和 Stats（包括最大值、最小值、平均值和总和等）。度量聚合适用于对数值型字段进行计算。 3. 管道（Pipeline）聚合：它们基于其他聚合的结果进行进一步的聚合操作，提供了更复杂的分析能力。在实际应用中，例如要统计酒店品牌，可以使用 Bucket 聚合。以下是一个示例的 DSL（Domain Specific Language）代码片段，展示如何实现这个统计： ```json GET /hotel/_search { "size": 0, // 设置size为0，返回结果中不包含文档，只返回聚合结果 "aggs": { // 定义聚合 "brandAgg": { // 给聚合起个名字 "terms": { // 选择Term聚合，按品牌值进行分组 "field": "brand", // 参与聚合的字段 "size": 20 // 希望获取的聚合结果数量 } } } } ``` 默认情况下，桶聚合会按文档数量进行降序排序。通过设置 `order` 属性，可以自定义排序方式。同时，为了确保聚合基于特定搜索条件进行，可以在查询中添加 `query` 条件，限制聚合的文档范围。例如，如果用户有搜索条件，聚合应仅针对搜索结果进行。这时，可以在请求中加入 `query` 部分来限定聚合的范围，以确保聚合结果的准确性。这样，聚合得到的品牌数量将与用户的搜索条件匹配。通过熟练掌握 Elasticsearch 中的数据聚合，可以实现更复杂、高效的分析任务，为业务决策提供强大支持。聚合功能的强大之处在于它不仅能够快速处理大量数据，还能够灵活地适应各种业务需求，使得数据分析变得简单而直观。

请求参数与搜索文档的参数完全一致。



返回值类型就是页面要展示的最终结果：

结果是一个Map结构：

key是字符串，城市、星级、品牌、价格

value是集合，例如多个城市的名称



1.3.3.业务实现

在 cn.itcast.hotel.web 包的 HotelController 中添加一个方法，遵循下面的要求：

请求方式： POST

请求路径： /hotel/filters

请求参数： RequestParams ，与搜索文档的参数一致

返回值类型： Map<String, List<String>>

代码：

剩余41页未读，继续阅读

think_act

粉丝: 1
资源: 5

Elasticsearch 数据聚合实战：统计与分析

elasticsearch-1.01

elasticsearch1.0

elasticsearch-1.1.1

day05-Elasticsearch01

西蒙 iphone opengl es 01

基恩士ES01系列接近传感器样本.pdf

基恩士ES01系列：超小型高精度接近传感器技术详解

Elasticsearch讲解-01_什么是Elasticsearch.mp4

01 - Elasticsearch 简单而高效的管道查询语言- ES QL 杭州 1.6 2024

ElasticSearch-day01.md

最新资源