Apache Atlas源码编译与安装指南:注意事项与关键配置
需积分: 50 91 浏览量
更新于2024-08-06
收藏 2.15MB PDF 举报
本文主要介绍了源码编译与安装Apache Atlas的相关注意事项,以及Apache Atlas的基础知识,包括项目背景、核心组件以及元数据模型。
Apache Atlas是数据治理的开源解决方案,由Hortonworks公司和其他厂商在2015年发起的数据治理倡议的产物。它提供了数据分类、集中策略引擎、数据血缘、安全和生命周期管理等功能,致力于与Apache Ranger集成以实现数据权限控制策略。目前,Apache Atlas的最新版本是2.0.0.1。
在源码编译和安装过程中需要注意以下几点:
1. 如果使用第三方镜像(如阿里云镜像)进行源码编译,可能会遇到某些jar包无法下载的问题,这时需要切换回Maven默认镜像来解决依赖问题。
2. 可以根据自己的集群环境,在pom.xml文件中调整Zookeeper和Hive等的版本号,以适应不同的部署需求。
3. 对于1.1.0版本,源码编译可能出现失败,此时可以通过修改pom.xml文件中的findbugs-maven-plugin插件版本至3.0.5来解决编译错误。
4. 在源码打包时,如果出现失败,可能是因为缺少solr和hbase的包。可以手动下载并放置到target目录下以完成打包过程。
Apache Atlas的安装步骤包括:
1. 解压缩Apache Atlas的bin包。
2. 配置atlas-application.properties文件,根据后端存储的选择(如hbase或cassandra)以及索引引擎(solr或ES)进行相应的设置。
在Apache Atlas的核心组件中,TypeSystem扮演了重要角色。它允许用户定义和管理元数据对象的模型,这些模型称为“类型”。每个类型的实例被称为“实体”,实体代表实际的元数据对象。类型系统包括基本元类型(如字符串、日期等)、枚举、集合元类型和复合元类型。例如,Hive_table就是一个实体类型,包含各种属性,如name、db、owner等,并且有特定的元类型和结构。
通过以上信息,我们可以理解Apache Atlas作为一个强大的数据治理工具,其核心在于对元数据的管理和控制,同时在源码编译和安装过程中需要注意解决依赖问题和适配不同环境。
317 浏览量
2012-09-02 上传
2020-09-04 上传
点击了解资源详情
2023-06-05 上传
2022-07-15 上传
2022-07-14 上传
啊宇哥哥
- 粉丝: 35
- 资源: 3863
最新资源
- gawiga-nextjs
- OOP_assignment
- compose-countdown-timer
- urban-dictionary:一个Node.js模块,可从urbandictionary.com访问术语和定义
- Payroll-6-12
- TeambitionNET
- 行业分类-设备装置-可移动升降平台.zip
- 易语言创建Access数据库-易语言
- starter-research-group
- leetcode-javascript
- hardhat-next-subgraph-mono:具有安全帽,Next和theGraph的Monorepo模板
- Catalog-开源
- du-an-1
- 行业分类-设备装置-可相互连接的纸质板材组件.zip
- SwiftySequencer:AESequencer 的快速实现
- my-profile