CDH6.2.1下flink-1.14.4-scala_2.12 parcel包整合指南
需积分: 5 49 浏览量
更新于2024-10-14
收藏 323.97MB TGZ 举报
资源摘要信息:"flink-1.14.4-scala_2.12 + CDH6.2.1 版 parcel 包"
知识点一:Flink介绍
Apache Flink是一个开源的分布式流处理框架,用于处理和分析实时数据流。它由数据并行和任务并行的流式数据处理组成。Flink提供了一个高效的分布式数据处理引擎用于各种数据处理任务,既包括传统的批处理任务,也包括复杂的事件驱动的实时数据处理任务。
知识点二:CDH介绍
CDH(Cloudera's Distribution Including Apache Hadoop)是Cloudera公司基于Apache Hadoop推出的发行版。CDH简化了大数据的部署和管理,为用户提供了一个集成化、稳定性和安全性俱佳的大数据平台,广泛应用于各种大数据处理场景。
知识点三:Scala介绍
Scala是一种多范式编程语言,设计初衷是实现面向对象编程和函数式编程的无缝集成。Scala运行在Java虚拟机上,并兼容现有的Java程序,提供了一套简洁的语法,使得代码更加简洁和易于理解。Flink支持Scala作为开发语言,这对于熟悉Scala的开发者来说,可以更便捷地进行大数据应用的开发。
知识点四: parcel 包介绍
在Cloudera Manager管理的集群中, parcel 包是一种软件包,它为集群的主机添加了新的功能或服务。Parcel 包通常包含了必要的安装和配置文件,使得Cloudera Manager能够在集群中的节点上安装和启动服务。因此,flink-1.14.4-scala_2.12 + CDH6.2.1 版 parcel 包,就是一个结合了CDH6.2.1和Flink 1.14.4版本的安装包。
知识点五:文件结构解析
该压缩包子文件中包含的文件名称及其作用如下:
- FLINK-1.14.4-BIN-SCALA_2.12-el7.parcel:该文件是Flink的二进制安装包,其中包含了Flink的运行环境。
- FLINK-1.14.4-BIN-SCALA_2.12-el7.parcel.sha:该文件是Flink二进制包的校验文件,确保下载的包在传输过程中没有损坏。
- manifest.json:该文件是Cloudera Manager用来验证和解析parcel包结构的清单文件。
- FLINK_ON_YARN-1.14.4.jar、FLINK-1.14.4.jar:这两个jar文件是Flink在YARN上运行的相关服务jar包。
知识点六:文件存放路径解析
- /opt/cloudera/parcel-repo/:该路径是Cloudera Manager存储所有已下载的parcel包的默认目录。
- /opt/cloudera/csd/:该路径存放了Cloudera Service Descriptor(CSD)文件,用于添加自定义服务到Cloudera Manager。
- /opt/cloudera/parcels/FLINK/lib/flink/lib:这个路径是Flink parcel包中存放自定义lib库的路径。
知识点七:jar包介绍
- commons-cli-1.5.0.jar:该jar包是Apache Commons CLI库,用于处理命令行参数,Flink使用它来解析启动命令。
- flink-shaded-hadoop-3-uber-*.*.*.*.2.9.0-173-9.0.jar:该jar包是Flink集成的Hadoop包,它为Flink提供了与Hadoop集成的支持,可以处理Hadoop的文件系统、API等。
知识点八:Scala与Flink结合的开发优势
使用Scala作为开发语言进行Flink开发,可以为开发者带来多方面的优势。Scala语言简洁的语法结构有助于简化代码,降低代码复杂度。同时,Scala的函数式编程特性使得编写高并发和并行处理的应用程序变得更加容易。此外,Scala与Java的兼容性意味着Flink的开发者可以无障碍地利用Java生态中的大量库和工具。结合Flink强大的流处理能力,Scala开发者能够构建出更加高效和强大的大数据处理应用。
2022-05-07 上传
2020-11-07 上传
2022-05-07 上传
2020-04-20 上传
2020-07-19 上传
2022-07-01 上传
2021-04-15 上传
2023-04-24 上传
訾零
- 粉丝: 170
- 资源: 4
最新资源
- PureMVC AS3在Flash中的实践与演示:HelloFlash案例分析
- 掌握Makefile多目标编译与清理操作
- STM32-407芯片定时器控制与系统时钟管理
- 用Appwrite和React开发待办事项应用教程
- 利用深度强化学习开发股票交易代理策略
- 7小时快速入门HTML/CSS及JavaScript基础教程
- CentOS 7上通过Yum安装Percona Server 8.0.21教程
- C语言编程:锻炼计划设计与实现
- Python框架基准线创建与性能测试工具
- 6小时掌握JavaScript基础:深入解析与实例教程
- 专业技能工厂,培养数据科学家的摇篮
- 如何使用pg-dump创建PostgreSQL数据库备份
- 基于信任的移动人群感知招聘机制研究
- 掌握Hadoop:Linux下分布式数据平台的应用教程
- Vue购物中心开发与部署全流程指南
- 在Ubuntu环境下使用NDK-14编译libpng-1.6.40-android静态及动态库