Storm入门指南:中文版带书签

需积分: 9 25 下载量 32 浏览量 更新于2024-07-19 收藏 1.62MB PDF 举报
"《Getting Started with Storm - 中文版》是一本由韩飞翻译的Storm技术入门书籍,专为对分布式实时计算系统Storm感兴趣的读者设计。作者出于个人兴趣翻译,并强调水平有限,欢迎读者提出建议以便持续完善内容。该书旨在为Storm新手提供学习支持,强调学习交流的初衷,反对用于盈利或论坛积分积累等不当行为。 本书分为五个主要章节: 1. **第一章:基础** - 概述Storm的基本组件,如Spout(数据源)和Bolt(处理单元),以及Storm的一些核心属性。这部分会介绍如何运行Storm在本地和远程模式下,以及如何编写HelloWorld级别的Storm Topology。 2. **第二章:开始** - 讲解操作模式,区分本地和远程模式,并引导读者进行实践,如验证Java环境、创建工程、构建基本的Spout和Bolt,以及创建并运行主类。 3. **第三章:Topologies** - 详细探讨流分组的各种策略,包括Shuffle、Fields、All、自定义分组,以及LocalCluster和StormSubmitter的区别,同时介绍了分布式处理的实践应用(Distributed Processing Topologies)。 4. **第四章:Spouts** - 针对可靠性和不可靠的消息传递模式,讨论数据获取方式,如直接连接和队列消息,以及与DRPC(Direct Remote Procedure Call)相关的概念。 5. **第五章:Bolts** - 详述Bolt的生命周期、结构,区分可靠与不可靠Bolts,以及如何处理多流和多锚定,还介绍了如何使用IBasicBolt自动进行acknowledgement。 第六章以一个实际的Node.js Web应用为例,展示了如何将Storm集成到Web应用中,涉及用户导航、获取类别、用户历史记录、产品类别计数和新闻通知等多个Bolt的实现,并介绍了如何使用Redis作为数据存储。 《Getting Started with Storm - 中文版》是一本实用的教程,适合Storm初学者系统地学习和理解这个强大的实时计算框架,有助于快速上手并深入掌握其核心概念和技术。"