Azkaban3.33.0安装全攻略:避坑指南

3星 · 超过75%的资源 需积分: 10 39 下载量 99 浏览量 更新于2024-09-09 1 收藏 84KB DOCX 举报
"Azkaban3.33.0的安装步骤和配置详解" Azkaban是一款流行的开源工作流管理系统,用于调度和执行大数据处理任务。本文档详细介绍了Azkaban 3.33.0的安装过程,包括从源代码获取、编译、配置以及在MySQL数据库中的初始化。 首先,安装Azkaban需要Java 8或以上版本的JDK,以及Git工具。要获取最新版本的Azkaban源代码,通过以下命令克隆Azkaban的GitHub仓库: ```bash git clone https://github.com/azkaban/azkaban.git ``` 接着,进入克隆的目录,使用Gradle编译项目,生成可部署的tar或zip包: ```bash cd azkaban ./gradlew wdistTar # 创建tar.gz包 ./gradlew wdistZip # 或者创建zip包 ./gradlew clean # 如果不是首次构建,建议先清理 ``` 编译完成后,会在`build/distributions`目录下生成azkaban-web-server和azkaban-exec-server的压缩包。将这些压缩包复制到目标位置,例如`/opt/azkaban`,然后解压: ```bash tar -zxvf azkaban-web-server-3.33.0-1-g23f0cf2.tar.gz tar -zxvf azkaban-exec-server-3.33.0-1-g23f0cf2.tar.gz tar -zxvf azkaban-db-3.33.0-1-g23f0cf2.tar.gz ``` 为了设置数据库,你需要一个MySQL实例。在MySQL命令行中,创建Azkaban使用的数据库、用户并授予权限: ```sql CREATE DATABASE azkaban; CREATE USER 'username'@'%' IDENTIFIED BY 'password'; GRANT SELECT, INSERT, UPDATE, DELETE ON azkaban.* TO 'username'@'%' WITH GRANT OPTION; ``` 然后,导入Azkaban的SQL表结构到创建的数据库: ```bash mysql -u username -p azkaban < /path/to/azkaban-db-3.33.0-1-g23f0cf2/create-all-sql-3.33.0-1-g23f0cf2.sql; ``` 接下来是配置步骤。Azkaban的主要配置文件位于解压后的目录中的`conf`文件夹下,包括`azkaban.properties`(系统参数)和`azkaban-users.xml`(用户管理)。`azkaban.properties`需要配置如下参数(示例): ```properties # Azkaban Server配置 server.port=8081 jetty.resource.base.path=./webapp azkaban.flow.execid.max=50000 # 数据库配置 azkaban.jdbc.username=username azkaban.jdbc.password=password azkaban.jdbc.url=jdbc:mysql://localhost:3306/azkaban?useSSL=false azkaban.jdbc.driver=com.mysql.jdbc.Driver # 其他可能需要的配置 executor.port=12321 executor.host=localhost ``` `azkaban-users.xml`文件用于定义Azkaban用户和权限,根据实际需求编辑此文件。 完成配置后,启动Azkaban Web服务器和Executor服务。在对应的解压目录下运行: ```bash # 启动Web服务器 ./bin/azkaban-web-server.sh start # 启动Executor服务 ./bin/azkaban-executor-server.sh start ``` 至此,Azkaban 3.33.0已经成功安装并配置完毕,你可以通过Web控制台(默认地址:http://localhost:8081)登录并开始管理你的job。 请注意,上述步骤仅适用于本地测试和开发环境。在生产环境中,还需要考虑负载均衡、高可用性和安全配置。另外,Azkaban的Job类型包括Java、Shell、Hadoop MapReduce等,可根据需求编写和上传Job脚本,实现数据处理任务的自动化调度和执行。
2020-05-22 上传
版本:3.38,解压后,配置自己的环境可直接用 azkaban-3.38.0\azkaban-db azkaban-3.38.0\azkaban-exec-server azkaban-3.38.0\azkaban-solo-server azkaban-3.38.0\azkaban-web-server ----------------后续步骤------------------ 1.创建数据库并导入基本数据 (1)创建数据库 create database azkaban; (2)mysql授权 GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123456' WITH GRANT OPTION; FLUSH PRIVILEGES; (3)导入数据 use azkaban; source /opt/azkaban-3.38.0/azkaban-db/create-all-sql-0.1.0-SNAPSHOT.sql 2. ssl配置 cd /opt/azkaban-3.38.0\azkaban-web-server keytool -keystore keystore -alias jetty -genkey -keyalg RSA 输入密钥库口令: 再次输入新口令: 您的名字与姓氏是什么? [Unknown]: xue 您的组织单位名称是什么? [Unknown]: xue 您的组织名称是什么? [Unknown]: xue 您所在的城市或区域名称是什么? [Unknown]: beijing 您所在的省/市/自治区名称是什么? [Unknown]: beijing 该单位的双字母国家/地区代码是什么? [Unknown]: CN CN=xue, OU=xue, O=xue, L=beijing, ST=beijing, C=CN是否正确? [否]: Y 输入 的密钥口令 (如果和密钥库口令相同, 按回车): 3.修改azkaban-exec-server下配置文件,引入mysql的依赖包 (1)将azkaban-solo-server下conf、plugins、sql目录复制到azkaban-exec-server目录下 cd azkaban-3.38.0/azkaban-solo-server/ cp -a ./conf ./plugins ./sql ../azkaban-exec-server (2)修改azkaban-exec-server/conf/的azkaban.properties文件 # Azkaban Personalization Settings azkaban.name=master azkaban.label=My Local Azkaban azkaban.color=#FF3601 azkaban.default.servlet.path=/index web.resource.dir=web/ #修改时区 default.timezone.id=Asia/Shanghai # Azkaban UserManager class user.manager.class=azkaban.user.XmlUserManager #修改为绝对路径,否则可能找不到 user.manager.xml.file=/opt/azkaban-3.38.0/azkaban-exec-server/conf/azkaban-users.xml # Loader for projects executor.global.properties=/opt/azkaban-3.38.0/azkaban-exec-server/conf/global.properties azkaban.project.dir=projects database.type=mysql mysql.port=3306 mysql.host=master mysql.database=azkaban mysql.user=root mysql.password=123456 mysql.numconnections=100 (其他默认) 4. 在conf目录下新建log4j.properties文件 [root@master azkaban-exec-server]# vim conf/log4j.properties 复制以下内容到log4j文件: log4j.rootLogger=INFO, Console log4j.logger.azkaban=INFO, server log