Storm实时计算框架入门与实践指南
需积分: 10 29 浏览量
更新于2024-07-19
收藏 916KB PDF 举报
《Storm编程》是一本详细介绍大数据实时计算框架的自学文档,作者毛祥溢通过丰富的示例和理论阐述,引导读者理解实时计算的概念和其在IT行业的应用背景。实时计算主要应用于那些数据源持续不断、对响应时间有严格要求,以及数据量巨大且难以预估的场景,如金融交易、社交媒体分析等。
本书首先介绍了实时计算的相关技术,包括数据实时采集(如Kafka、Flume等)、数据实时计算(如Spark Streaming、Flink等)和实时查询服务。早期的实时计算产品如IBM的StreamBase和Borealis,以及后来的Yahoo的S4、Twitter实时计算、Facebook的Puma和淘宝的实时计算框架,展示了技术的发展历程。
章节二重点转向Storm框架,作为核心部分。Storm是一个分布式实时计算系统,以其易用性和可扩展性著称。Storm的特性包括容错处理、高吞吐量和低延迟。核心组件包括Spout(数据源)和Bolt(处理逻辑),以及StreamGroupings用于连接Spout和Bolt。Zookeeper作为分布式协调服务,确保系统的可靠运行。
文档后续内容涵盖了在Redhat环境中搭建Storm的伪分布式环境,包括配置安装步骤、Zookeeper集群的搭建,以及如何配置和启动Storm实例,提交任务。此外,书中还提供了实战示例,如编写一个简单的WordCounter单词计数器程序,展示了如何使用Storm进行数据处理,从WordReader读取文本数据,通过WordNormalizer切割单词,最后统计单词出现次数。
《Storm编程》不仅教授了Storm的技术细节,还强调了将函数式编程思想融入面向对象编程中的实践技巧,适合想要学习和深入理解大数据实时计算的开发者和数据工程师。通过阅读这本书,读者能够掌握如何在实际项目中高效利用Storm进行实时数据分析。
2019-07-19 上传
点击了解资源详情
2024-11-15 上传
2024-11-15 上传
斜阳13
- 粉丝: 1
- 资源: 12
最新资源
- Java集合ArrayList实现字符串管理及效果展示
- 实现2D3D相机拾取射线的关键技术
- LiveLy-公寓管理门户:创新体验与技术实现
- 易语言打造的快捷禁止程序运行小工具
- Microgateway核心:实现配置和插件的主端口转发
- 掌握Java基本操作:增删查改入门代码详解
- Apache Tomcat 7.0.109 Windows版下载指南
- Qt实现文件系统浏览器界面设计与功能开发
- ReactJS新手实验:搭建与运行教程
- 探索生成艺术:几个月创意Processing实验
- Django框架下Cisco IOx平台实战开发案例源码解析
- 在Linux环境下配置Java版VTK开发环境
- 29街网上城市公司网站系统v1.0:企业建站全面解决方案
- WordPress CMB2插件的Suggest字段类型使用教程
- TCP协议实现的Java桌面聊天客户端应用
- ANR-WatchDog: 检测Android应用无响应并报告异常