CentOS上安装Azkaban详细步骤

需积分: 9 3 下载量 61 浏览量 更新于2024-09-09 收藏 4KB MD 举报
"Azkaban是开源的工作流管理系统,用于调度和执行复杂的批处理作业。本文档将指导你在CentOS系统上进行Azkaban的个性化设置和安装。" Azkaban是一个专为大数据处理任务设计的工作流调度器,它提供了一个用户友好的Web界面来管理和执行依赖关系明确的作业流程。在CentOS上安装Azkaban涉及以下几个关键步骤: 1. 下载Azkaban源码: 首先,你需要进入你的应用源码目录`/opt/application/src/`,然后使用Git克隆Azkaban的GitHub仓库: ```bash cd /opt/application/src/ git clone https://github.com/azkaban/azkaban.git cd azkaban git checkout 3.38.0 ``` 这里我们选择了版本3.38.0,你可以根据实际需求选择其他稳定版本。 2. 构建Azkaban: 在构建Azkaban之前,确保系统已安装了`gcc-c++`编译器。接下来,你可以使用Gradle(一个Java构建工具)来构建项目: ```bash # 安装必要的编译器 sudo yum -y install gcc-c++ # 清理并构建Azkaban ./gradlew clean ./gradlew build # 如果不运行测试,可以使用以下命令 ./gradlew build -xtest ``` 如果Gradle首次运行时下载速度较慢,你可以手动下载所需的Gradle版本,并将其放在项目的`gradle/wrapper`目录下,同时更新`gradle-wrapper.properties`文件的`distributionUrl`。 3. 配置Azkaban: 构建完成后,你需要配置Azkaban的服务器部分,包括Web服务器和执行服务器。复制配置文件到相应的位置: ```bash cp -r azkaban-solo-server/build/install/azkaban-solo-server/conf/azkaban-web-server/* azkaban-solo-server cp -r azkaban-solo-server/build/install/azkaban-solo-server/conf/azkaban-exec-server/* azkaban-exec-server cp -r azkaban-solo-server/build/install/azkaban-solo-server/plugins/azkaban-exec-server/* azkaban-exec-server ``` 这些配置文件包括Azkaban服务器的基本设置、数据库连接信息以及插件配置等。 4. 启动Azkaban: 配置完成后,你可以启动Azkaban的Web服务器和执行服务器。启动命令通常位于Azkaban安装目录的`bin`目录下,如`azkaban-solo-server/bin`。执行以下命令: ```bash # 启动Web服务器 ./start-azkaban-web-server.sh # 启动执行服务器 ./start-azkaban-executor-server.sh ``` 5. 访问Azkaban Web界面: Azkaban Web服务器启动后,你可以通过浏览器访问`http://your_server_ip:8081`来查看和管理你的工作流。 6. 个人化设置: Azkaban允许你根据自己的需求进行个性化设置,例如自定义用户权限、日志级别、邮件通知等。这些设置主要通过修改`conf`目录下的配置文件实现。 7. 创建和执行工作流: 一旦Azkaban运行起来,你可以使用其Web界面创建新的工作流,定义作业间的依赖,并安排它们的执行时间。 8. 监控与管理: Azkaban提供了强大的监控功能,可以查看作业状态、日志信息以及整个工作流的执行历史。 安装和配置Azkaban是部署大数据作业自动化的关键步骤,理解并掌握这些过程有助于更有效地管理你的数据处理任务。在实际操作中,记得根据你的具体环境调整上述步骤,确保Azkaban能够顺利集成到你的系统中。
2020-05-22 上传
版本:3.38,解压后,配置自己的环境可直接用 azkaban-3.38.0\azkaban-db azkaban-3.38.0\azkaban-exec-server azkaban-3.38.0\azkaban-solo-server azkaban-3.38.0\azkaban-web-server ----------------后续步骤------------------ 1.创建数据库并导入基本数据 (1)创建数据库 create database azkaban; (2)mysql授权 GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123456' WITH GRANT OPTION; FLUSH PRIVILEGES; (3)导入数据 use azkaban; source /opt/azkaban-3.38.0/azkaban-db/create-all-sql-0.1.0-SNAPSHOT.sql 2. ssl配置 cd /opt/azkaban-3.38.0\azkaban-web-server keytool -keystore keystore -alias jetty -genkey -keyalg RSA 输入密钥库口令: 再次输入新口令: 您的名字与姓氏是什么? [Unknown]: xue 您的组织单位名称是什么? [Unknown]: xue 您的组织名称是什么? [Unknown]: xue 您所在的城市或区域名称是什么? [Unknown]: beijing 您所在的省/市/自治区名称是什么? [Unknown]: beijing 该单位的双字母国家/地区代码是什么? [Unknown]: CN CN=xue, OU=xue, O=xue, L=beijing, ST=beijing, C=CN是否正确? [否]: Y 输入 的密钥口令 (如果和密钥库口令相同, 按回车): 3.修改azkaban-exec-server下配置文件,引入mysql的依赖包 (1)将azkaban-solo-server下conf、plugins、sql目录复制到azkaban-exec-server目录下 cd azkaban-3.38.0/azkaban-solo-server/ cp -a ./conf ./plugins ./sql ../azkaban-exec-server (2)修改azkaban-exec-server/conf/的azkaban.properties文件 # Azkaban Personalization Settings azkaban.name=master azkaban.label=My Local Azkaban azkaban.color=#FF3601 azkaban.default.servlet.path=/index web.resource.dir=web/ #修改时区 default.timezone.id=Asia/Shanghai # Azkaban UserManager class user.manager.class=azkaban.user.XmlUserManager #修改为绝对路径,否则可能找不到 user.manager.xml.file=/opt/azkaban-3.38.0/azkaban-exec-server/conf/azkaban-users.xml # Loader for projects executor.global.properties=/opt/azkaban-3.38.0/azkaban-exec-server/conf/global.properties azkaban.project.dir=projects database.type=mysql mysql.port=3306 mysql.host=master mysql.database=azkaban mysql.user=root mysql.password=123456 mysql.numconnections=100 (其他默认) 4. 在conf目录下新建log4j.properties文件 [root@master azkaban-exec-server]# vim conf/log4j.properties 复制以下内容到log4j文件: log4j.rootLogger=INFO, Console log4j.logger.azkaban=INFO, server log