没有合适的资源?快使用搜索试试~ 我知道了~
首页Elasticsearch权威指南:分布式实时搜索与数据分析
Elasticsearch权威指南:分布式实时搜索与数据分析
需积分: 10 15 下载量 73 浏览量
更新于2024-07-17
收藏 7.93MB PDF 举报
《Elasticsearch权威指南》是一本实用的书籍,专为想要充分利用分布式实时搜索和分析功能的读者而设计。本书适合不同层次的用户,无论你是搜索和分布式系统的新手,还是经验丰富的开发者,都能从中获益匪浅。
对于新手而言,书中提供了入门级教程,循序渐进地介绍如何将Elasticsearch集成到应用程序中,使你掌握基础的全文搜索、索引数据以及理解诸如相关性和词语关联等搜索概念。作者通过问题导向的方法,帮助你理解何时、何地以及如何有效地运用Elasticsearch的各项特性,确保你能够快速上手并建立起对搜索引擎的工作原理的深入理解。
对于有经验的用户,这本书则深入剖析了高级技巧,包括如何处理人类语言,利用分析器和查询工具进行精准的语言处理,从而提升搜索结果的质量。作者强调了如何通过聚合和分析功能对数据进行汇总和展示整体趋势,这对于理解和解读大规模数据中的模式和行为至关重要。
书中还专门探讨了Elasticsearch在地理位置信息处理方面的强大能力,介绍了如何使用地理点和地理形状来处理空间数据,这对于地理位置相关的应用尤其有用。此外,作者还指导读者如何利用Elasticsearch的水平扩展性,优化数据模型,以适应不断增长的数据需求。
对于生产环境中的配置与监控,本书同样给予了详尽的指导,确保你在实际部署和维护Elasticsearch集群时能够做出明智的决策。整体来说,《Elasticsearch权威指南》不仅教你如何操作这个强大的搜索引擎,还为你揭示了其背后的复杂逻辑和技术细节,使你成为Elasticsearch的高效使用者和管理者。
如果你是一名对搜索技术或分布式系统感兴趣的专业人士,或者正在寻找一种高效的方式来管理结构化数据,这本书无疑是你的不二之选。它不仅是技术实践的宝典,也是理论与实践相结合的桥梁,帮助你跨越搜索和分布式系统知识的门槛,让你在数据驱动的世界中游刃有余。
![](https://csdnimg.cn/release/download_crawler_static/10969820/bg10.jpg)
25. High-Level Concepts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
Buckets 420
Metrics 420
Combining the Two 420
26.
Aggregation Test-Drive. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
Adding a Metric to the Mix 426
Buckets Inside Buckets 427
One Final Modification 429
27. Building Bar Charts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
28. Looking at Time. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 437
Returning Empty Buckets 439
Extended Example 441
The Sky’s the Limit 443
29.
Scoping Aggregations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
30.
Filtering Queries and Aggregations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449
Filtered Query 449
Filter Bucket 450
Post Filter 451
Recap 452
31.
Sorting Multivalue Buckets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453
Intrinsic Sorts 453
Sorting by a Metric 454
Sorting Based on “Deep” Metrics 455
32.
Approximate Aggregations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457
Finding Distinct Counts 458
Understanding the Trade-offs 460
Optimizing for Speed 461
Calculating Percentiles 462
Percentile Metric 464
Percentile Ranks 467
Understanding the Trade-offs 469
33.
Signicant Terms. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471
significant_terms Demo 472
Recommending Based on Popularity 474
xiv | Table of Contents
![](https://csdnimg.cn/release/download_crawler_static/10969820/bg11.jpg)
Recommending Based on Statistics 478
34. Controlling Memory Use and Latency. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481
Fielddata 481
Aggregations and Analysis 483
High-Cardinality Memory Implications 486
Limiting Memory Usage 487
Fielddata Size 488
Monitoring fielddata 489
Circuit Breaker 490
Fielddata Filtering 491
Doc Values 493
Enabling Doc Values 494
Preloading Fielddata 494
Eagerly Loading Fielddata 495
Global Ordinals 496
Index Warmers 498
Preventing Combinatorial Explosions 500
Depth-First Versus Breadth-First 502
35.
Closing Thoughts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507
Part V. Geolocation
36.
Geo-Points. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 511
Lat/Lon Formats 511
Filtering by Geo-Point 512
geo_bounding_box Filter 513
Optimizing Bounding Boxes 514
geo_distance Filter 515
Faster Geo-Distance Calculations 516
geo_distance_range Filter 517
Caching geo-filters 517
Reducing Memory Usage 519
Sorting by Distance 520
Scoring by Distance 522
37.
Geohashes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523
Mapping Geohashes 524
geohash_cell Filter 525
Table of Contents | xv
![](https://csdnimg.cn/release/download_crawler_static/10969820/bg12.jpg)
38. Geo-aggregations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527
geo_distance Aggregation 527
geohash_grid Aggregation 530
geo_bounds Aggregation 532
39.
Geo-shapes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535
Mapping geo-shapes 536
precision 536
distance_error_pct 537
Indexing geo-shapes 537
Querying geo-shapes 538
Querying with Indexed Shapes 540
Geo-shape Filters and Caching 541
Part VI. Modeling Your Data
40.
Handling Relationships. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545
Application-side Joins 546
Denormalizing Your Data 548
Field Collapsing 549
Denormalization and Concurrency 552
Renaming Files and Directories 555
Solving Concurrency Issues 555
Global Locking 556
Document Locking 557
Tree Locking 558
41.
Nested Objects. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 561
Nested Object Mapping 563
Querying a Nested Object 564
Sorting by Nested Fields 565
Nested Aggregations 567
reverse_nested Aggregation 568
When to Use Nested Objects 570
42.
Parent-Child Relationship. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571
Parent-Child Mapping 572
Indexing Parents and Children 572
Finding Parents by Their Children 573
min_children and max_children 575
Finding Children by Their Parents 575
xvi | Table of Contents
![](https://csdnimg.cn/release/download_crawler_static/10969820/bg13.jpg)
Children Aggregation 576
Grandparents and Grandchildren 577
Practical Considerations 579
Memory Use 579
Global Ordinals and Latency 580
Multigenerations and Concluding Thoughts 580
43.
Designing for Scale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583
The Unit of Scale 583
Shard Overallocation 585
Kagillion Shards 586
Capacity Planning 587
Replica Shards 588
Balancing Load with Replicas 589
Multiple Indices 590
Time-Based Data 592
Index per Time Frame 592
Index Templates 593
Retiring Data 594
Migrate Old Indices 595
Optimize Indices 595
Closing Old Indices 596
Archiving Old Indices 596
User-Based Data 597
Shared Index 597
Faking Index per User with Aliases 600
One Big User 601
Scale Is Not Infinite 602
Part VII. Administration, Monitoring, and Deployment
44.
Monitoring. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607
Marvel for Monitoring 607
Cluster Health 608
Drilling Deeper: Finding Problematic Indices 609
Blocking for Status Changes 611
Monitoring Individual Nodes 612
indices Section 613
OS and Process Sections 616
JVM Section 617
Threadpool Section 620
Table of Contents | xvii
![](https://csdnimg.cn/release/download_crawler_static/10969820/bg14.jpg)
FS and Network Sections 622
Circuit Breaker 622
Cluster Stats 623
Index Stats 623
Pending Tasks 624
cat API 626
45.
Production Deployment. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 631
Hardware 631
Memory 631
CPUs 632
Disks 632
Network 633
General Considerations 633
Java Virtual Machine 634
Transport Client Versus Node Client 634
Configuration Management 635
Important Configuration Changes 635
Assign Names 636
Paths 636
Minimum Master Nodes 637
Recovery Settings 638
Prefer Unicast over Multicast 639
Don’t Touch These Settings! 640
Garbage Collector 640
Threadpools 641
Heap: Sizing and Swapping 641
Give Half Your Memory to Lucene 642
Don’t Cross 32 GB! 642
Swapping Is the Death of Performance 644
File Descriptors and MMap 645
Revisit This List Before Production 646
46.
Post-Deployment. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647
Changing Settings Dynamically 647
Logging 648
Slowlog 648
Indexing Performance Tips 649
Test Performance Scientifically 650
Using and Sizing Bulk Requests 650
Storage 651
Segments and Merging 651
xviii | Table of Contents
剩余718页未读,继续阅读
111 浏览量
144 浏览量
106 浏览量
121 浏览量
2021-05-23 上传
2011-06-30 上传
2021-02-16 上传
loolly-elasticsearch-definitive-guide 官网ES文档中文翻译|loolly-elasticsearch-definitive-guide-cn-master.zip
245 浏览量
132 浏览量
![](https://profile-avatar.csdnimg.cn/aaa77ef8e5114159a73c1934bf37f3a4_polar9527.jpg!1)
alex6801
- 粉丝: 64
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
最新资源
- 编程精粹:打造无错C程序的微软技术
- 微软软件测试方法探索与实践经验
- Windows Sockets编程规范与实战指南
- MySQL 5.0中文参考手册:安装与升级指南
- Java Web Start技术详解与应用
- 嵌入式C/C++编程精华:从基础到实战深度解析
- Windows上配置PHP5.2.5+Apache2.2.8+MySQL5+phpMyAdmin详细教程
- 硬盘优化与故障处理全攻略:提升速度与寿命
- ArcGIS Engine入门教程:从基础到应用
- Spring入门:理解IoC与DI基础
- Linux Socket编程基础:接口、功能与实例
- 理解SDRAM内存:物理Bank与逻辑Bank详解
- 配置AD与Domino目录同步:步骤与指南
- Flex 2.0安装与开发环境搭建指南
- Subversion版控教程:从入门到高级操作详解
- 自制验证码生成器:简单实现与应用
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)