没有合适的资源?快使用搜索试试~ 我知道了~
首页深入理解Elasticsearch:分布式实时搜索与分析引擎实战
"Elasticsearch- The Definitive Guide 是一本深入探讨Elasticsearch的实用指南,适合初学者和有经验的用户,旨在帮助读者理解如何利用Elasticsearch进行全文搜索、实时结构化数据分析,以及处理语言复杂性、地理位置和关系问题。本书采用问题驱动的方法,教你何时何地以及如何使用Elasticsearch的各种特性。"
在这本全面的指南中,作者Clinton Gormley和Zachary Tong详细介绍了Elasticsearch——一个分布式实时的搜索和分析引擎。Elasticsearch因其强大的功能,被广泛应用于数据检索和分析场景。无论是对于全文搜索的需求,还是对结构化数据的实时分析,Elasticsearch都能提供高效解决方案。
书中首先介绍了Elasticsearch的基础知识,包括如何安装和配置,以及如何创建、索引和搜索文档。对于初学者,这部分内容将帮助他们快速理解如何将Elasticsearch整合到自己的应用程序中。Elasticsearch的分布式特性使得它在处理大量数据时表现优秀,书中的实例将展示如何利用这些特性来构建可扩展的系统。
对于处理人类语言的复杂性,Elasticsearch提供了丰富的文本分析功能。这包括词干提取、停用词过滤、同义词处理等,以提高搜索的相关性和准确性。书中会详细解释如何自定义分析器来适应各种语言环境。
在地理位置处理方面,Elasticsearch支持地理空间数据索引和查询,使得能够进行地理位置相关的搜索和分析。这在物流、旅游、零售等行业中非常有用。读者将学习如何存储和查询地理坐标,以及如何进行距离计算。
此外,Elasticsearch还允许处理实体之间的关系,这对于关联数据的分析非常关键。书中会介绍如何使用nested和object类型来表示复杂的数据结构,以及如何执行复杂的聚合操作来发现数据模式。
对于有经验的用户,书中涵盖了许多高级技术,如性能调优、集群管理和安全设置。这些章节将帮助用户提升Elasticsearch系统的稳定性和效率,同时确保数据的安全。
"Elasticsearch: The Definitive Guide"是一本全面而深入的教程,不仅教会读者如何使用Elasticsearch,还教导他们如何解决实际问题,充分利用其搜索和分析能力。无论你是新手还是资深开发者,这本书都将是你探索Elasticsearch世界的宝贵资源。
25. High-Level Concepts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
Buckets 420
Metrics 420
Combining the Two 420
26.
Aggregation Test-Drive. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
Adding a Metric to the Mix 426
Buckets Inside Buckets 427
One Final Modification 429
27. Building Bar Charts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
28. Looking at Time. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 437
Returning Empty Buckets 439
Extended Example 441
The Sky’s the Limit 443
29.
Scoping Aggregations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
30.
Filtering Queries and Aggregations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449
Filtered Query 449
Filter Bucket 450
Post Filter 451
Recap 452
31.
Sorting Multivalue Buckets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453
Intrinsic Sorts 453
Sorting by a Metric 454
Sorting Based on “Deep” Metrics 455
32.
Approximate Aggregations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457
Finding Distinct Counts 458
Understanding the Trade-offs 460
Optimizing for Speed 461
Calculating Percentiles 462
Percentile Metric 464
Percentile Ranks 467
Understanding the Trade-offs 469
33.
Signicant Terms. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471
significant_terms Demo 472
Recommending Based on Popularity 474
xiv | Table of Contents
www.it-ebooks.info
Recommending Based on Statistics 478
34. Controlling Memory Use and Latency. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481
Fielddata 481
Aggregations and Analysis 483
High-Cardinality Memory Implications 486
Limiting Memory Usage 487
Fielddata Size 488
Monitoring fielddata 489
Circuit Breaker 490
Fielddata Filtering 491
Doc Values 493
Enabling Doc Values 494
Preloading Fielddata 494
Eagerly Loading Fielddata 495
Global Ordinals 496
Index Warmers 498
Preventing Combinatorial Explosions 500
Depth-First Versus Breadth-First 502
35.
Closing Thoughts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507
Part V. Geolocation
36.
Geo-Points. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 511
Lat/Lon Formats 511
Filtering by Geo-Point 512
geo_bounding_box Filter 513
Optimizing Bounding Boxes 514
geo_distance Filter 515
Faster Geo-Distance Calculations 516
geo_distance_range Filter 517
Caching geo-filters 517
Reducing Memory Usage 519
Sorting by Distance 520
Scoring by Distance 522
37.
Geohashes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523
Mapping Geohashes 524
geohash_cell Filter 525
Table of Contents | xv
www.it-ebooks.info
38. Geo-aggregations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527
geo_distance Aggregation 527
geohash_grid Aggregation 530
geo_bounds Aggregation 532
39.
Geo-shapes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535
Mapping geo-shapes 536
precision 536
distance_error_pct 537
Indexing geo-shapes 537
Querying geo-shapes 538
Querying with Indexed Shapes 540
Geo-shape Filters and Caching 541
Part VI. Modeling Your Data
40.
Handling Relationships. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545
Application-side Joins 546
Denormalizing Your Data 548
Field Collapsing 549
Denormalization and Concurrency 552
Renaming Files and Directories 555
Solving Concurrency Issues 555
Global Locking 556
Document Locking 557
Tree Locking 558
41.
Nested Objects. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 561
Nested Object Mapping 563
Querying a Nested Object 564
Sorting by Nested Fields 565
Nested Aggregations 567
reverse_nested Aggregation 568
When to Use Nested Objects 570
42.
Parent-Child Relationship. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571
Parent-Child Mapping 572
Indexing Parents and Children 572
Finding Parents by Their Children 573
min_children and max_children 575
Finding Children by Their Parents 575
xvi | Table of Contents
www.it-ebooks.info
Children Aggregation 576
Grandparents and Grandchildren 577
Practical Considerations 579
Memory Use 579
Global Ordinals and Latency 580
Multigenerations and Concluding Thoughts 580
43.
Designing for Scale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583
The Unit of Scale 583
Shard Overallocation 585
Kagillion Shards 586
Capacity Planning 587
Replica Shards 588
Balancing Load with Replicas 589
Multiple Indices 590
Time-Based Data 592
Index per Time Frame 592
Index Templates 593
Retiring Data 594
Migrate Old Indices 595
Optimize Indices 595
Closing Old Indices 596
Archiving Old Indices 596
User-Based Data 597
Shared Index 597
Faking Index per User with Aliases 600
One Big User 601
Scale Is Not Infinite 602
Part VII. Administration, Monitoring, and Deployment
44.
Monitoring. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607
Marvel for Monitoring 607
Cluster Health 608
Drilling Deeper: Finding Problematic Indices 609
Blocking for Status Changes 611
Monitoring Individual Nodes 612
indices Section 613
OS and Process Sections 616
JVM Section 617
Threadpool Section 620
Table of Contents | xvii
www.it-ebooks.info
FS and Network Sections 622
Circuit Breaker 622
Cluster Stats 623
Index Stats 623
Pending Tasks 624
cat API 626
45.
Production Deployment. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 631
Hardware 631
Memory 631
CPUs 632
Disks 632
Network 633
General Considerations 633
Java Virtual Machine 634
Transport Client Versus Node Client 634
Configuration Management 635
Important Configuration Changes 635
Assign Names 636
Paths 636
Minimum Master Nodes 637
Recovery Settings 638
Prefer Unicast over Multicast 639
Don’t Touch These Settings! 640
Garbage Collector 640
Threadpools 641
Heap: Sizing and Swapping 641
Give Half Your Memory to Lucene 642
Don’t Cross 32 GB! 642
Swapping Is the Death of Performance 644
File Descriptors and MMap 645
Revisit This List Before Production 646
46.
Post-Deployment. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647
Changing Settings Dynamically 647
Logging 648
Slowlog 648
Indexing Performance Tips 649
Test Performance Scientifically 650
Using and Sizing Bulk Requests 650
Storage 651
Segments and Merging 651
xviii | Table of Contents
www.it-ebooks.info
剩余718页未读,继续阅读
点击了解资源详情
点击了解资源详情
点击了解资源详情
2019-06-18 上传
2018-08-22 上传
2021-05-23 上传
loolly-elasticsearch-definitive-guide 官网ES文档中文翻译|loolly-elasticsearch-definitive-guide-cn-master.zip
238 浏览量
118 浏览量
2021-10-09 上传
vanridin
- 粉丝: 108
- 资源: 1187
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功