Storm入门教程:中文翻译版
"Getting.Started.with.Storm 中文翻译" 本书是关于Apache Storm的入门教程,由韩飞翻译,旨在帮助初学者了解和掌握这个实时计算系统。Apache Storm是一个开源的分布式计算系统,常用于处理和分析实时数据流。它允许开发者创建容错且可扩展的实时处理管道。 在第一章“基础”中,介绍了Storm的核心组件,包括Spout(数据源)和Bolt(数据处理器)。Storm属性这部分讲述了配置和管理Storm集群的关键设置。 第二章“开始”讲解了两种操作模式:本地模式(用于本地开发和测试)和远程模式(用于部署到生产环境)。通过一个简单的"HelloWorldStorm"示例,读者将学习如何验证Java安装、创建项目以及构建第一个Topology。Topology是Storm中处理数据流的基本单位,由Spout和Bolt组成。 第三章“Topologies”深入讨论了数据流的分组方式,如Shuffle分组(随机分发)、Fields分组(基于字段的分组)、All分组(所有副本都收到数据)、Direct分组(直接指定目标bolt)、Global分组(全局分组,所有数据都发送到同一个bolt)、None分组(无分组)以及Direct和Global分组的特殊用法。此外,还解释了LocalCluster与StormSubmitter的区别,以及DPRC(DrpcRequest)Topologies的应用。 第四章“Spouts”探讨了消息传递的可靠性,区分了可靠消息和不可靠消息的处理方式。Spout是数据流的源头,可以连接到各种数据源,例如直接连接、队列消息等。DRPC(Distributed Remote Procedure Call)是一种让其他应用程序向Storm提交计算任务的功能。 第五章“Bolts”介绍Bolt的生命周期和结构,包括可靠的Bolts与不可靠的Bolts之间的差异。Bolt可以处理多个数据流,并且支持多锚定,即一个tuple可以触发多个新的tuple。通过IBasicBolt接口,可以简化ack机制,自动处理数据确认。 第六章“一个真实的示例”中,通过一个Node.js Web应用的案例展示了如何构建一个完整的Storm Topology。案例涵盖了从用户导航Spout、获取类别Bolt、用户历史Bolt、产品类别计数Bolt到新闻通知Bolt的整个流程,以及如何与Redis服务器交互来存储和检索数据,以及生产环境的信息发布。 通过这个教程,读者将全面了解Apache Storm的基本概念、工作原理以及实际应用,为后续深入学习和使用Storm打下坚实的基础。
- 粉丝: 84
- 资源: 14
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 构建Cadence PSpice仿真模型库教程
- VMware 10.0安装指南:步骤详解与网络、文件共享解决方案
- 中国互联网20周年必读:影响行业的100本经典书籍
- SQL Server 2000 Analysis Services的经典MDX查询示例
- VC6.0 MFC操作Excel教程:亲测Win7下的应用与保存技巧
- 使用Python NetworkX处理网络图
- 科技驱动:计算机控制技术的革新与应用
- MF-1型机器人硬件与robobasic编程详解
- ADC性能指标解析:超越位数、SNR和谐波
- 通用示波器改造为逻辑分析仪:0-1字符显示与电路设计
- C++实现TCP控制台客户端
- SOA架构下ESB在卷烟厂的信息整合与决策支持
- 三维人脸识别:技术进展与应用解析
- 单张人脸图像的眼镜边框自动去除方法
- C语言绘制图形:余弦曲线与正弦函数示例
- Matlab 文件操作入门:fopen、fclose、fprintf、fscanf 等函数使用详解