Kylo 数据湖平台安装与配置指南 v0.8.3
需积分: 9 64 浏览量
更新于2024-07-19
收藏 8.12MB PDF 举报
"Kylo v0.8.3 文档是一个详细指南,由ThinkBig(现为Teradata公司)发布,涵盖了关于Kylo平台的各个方面,包括其特性、常见问题解答、术语定义、版本更新、下载信息、安装步骤、配置、权限设置以及安全方面的内容。文档旨在帮助用户理解并部署基于Apache Hadoop和Spark的数据湖解决方案Kylo。"
Kylo是一个全面的数据湖平台,它构建在Hadoop和Spark之上,提供了企业级的数据摄取、数据准备和数据发现功能。Kylo的目标是提供一个即开即用、对业务友好的数据湖解决方案,使得数据处理流程更加便捷。在Kylo v0.8.3的文档中,我们可以找到以下关键知识点:
1. **Kylo概述**:这部分可能包含Kylo的基本概念、设计理念和它如何与Hadoop和Spark生态系统集成。
2. **特性**:Kylo的特色功能,如数据治理、元数据管理、数据质量检查、工作流管理等,可能在此部分详细介绍。
3. **FAQ**:常见问题解答可以帮助用户解决在使用Kylo过程中可能遇到的问题,提高部署和使用的效率。
4. **术语**:定义了与Kylo相关的专业术语,有助于用户理解文档中的专业词汇。
5. **发布笔记**:记录了v0.8.3版本的更新内容和改进,包括新功能、修复的bug和性能优化。
6. **下载**:提供了获取Kylo软件的链接和不同组件的安装包信息。
7. **安装准备**:包括系统需求、依赖检查和安装前的准备工作。
8. **服务账户创建**:说明如何为Kylo创建和管理服务账户,这是安全操作的重要环节。
9. **离线TAR准备**:离线安装的步骤,适用于没有网络连接或需要在隔离环境中部署的情况。
10. **安装Kylo**:详细指导用户如何安装Kylo,包括基本配置和验证过程。
11. **安装额外组件**:可能包括如Ranger、Sentry这样的安全组件,或者其他的扩展功能。
12. **启用Kerberos**:Kerberos是一种安全认证协议,用于实现Hadoop环境的身份验证。
13. **额外配置**:可能涵盖更高级的设置,如内存调整、Java环境配置等。
14. **授予HDFS权限**:确保正确设置用户和角色对HDFS资源的访问权限。
15. **启动服务**:启动Kylo及其依赖服务的步骤。
16. **导入模板**:使用预定义模板加速数据处理流程。
17. **创建样本馈送**:通过示例数据来测试和验证Kylo的功能。
18. **配置验证**:检查安装和配置是否正确,确保系统能够正常运行。
19. **HDP 2.5 Kerberos/Ranger集群部署指南**:针对特定Hadoop发行版的安全配置。
20. **Yarn集群模式配置**:优化Yarn以支持Kylo在集群环境中的高效运行。
21. **Kylo Spark属性**:调整Kylo与Spark交互的配置参数,以优化性能。
22. **Postgres Metastore配置**:使用Postgres作为元数据存储的设置方法。
23. **加密配置属性**:确保敏感配置信息的安全。
24. **日志文件**:日志管理和监控的相关信息。
25. **身份验证**:涉及用户登录和权限验证的机制。
26. **Kylo Kerberos SPNEGO**:使用Kerberos进行无感知认证(SPNEGO)的设置。
27. **访问控制**:如何管理用户和角色的访问权限。
28. **Spark用户模拟配置**:允许Spark作业以其他用户的身份运行,增强安全性。
29. **启用Ranger授权**:使用Ranger进行细粒度的访问控制。
30. **启用Sentry授权**:Sentry是另一个提供Hadoop数据访问控制的服务。
31. **Kylo UI和SSL**:使用SSL加密Web界面通信,保护用户交互数据。
32. **NiFi和SSL**:NiFi是数据流管理工具,SSL配置确保其传输安全。
33. **认证**:整体认证策略和流程的概述。
此文档详细阐述了Kylo的安装、配置和管理,对于想要利用Hadoop和Spark构建数据湖的企业和开发人员来说,是一份宝贵的参考资料。通过深入学习和实践,用户可以有效地利用Kylo来管理和分析大数据。
2018-10-16 上传
2021-04-18 上传
2021-04-29 上传
2018-08-02 上传
2017-02-26 上传
2021-04-06 上传
2021-03-15 上传
点击了解资源详情
养喵少年
- 粉丝: 54
- 资源: 3
最新资源
- 深入浅出:自定义 Grunt 任务的实践指南
- 网络物理突变工具的多点路径规划实现与分析
- multifeed: 实现多作者间的超核心共享与同步技术
- C++商品交易系统实习项目详细要求
- macOS系统Python模块whl包安装教程
- 掌握fullstackJS:构建React框架与快速开发应用
- React-Purify: 实现React组件纯净方法的工具介绍
- deck.js:构建现代HTML演示的JavaScript库
- nunn:现代C++17实现的机器学习库开源项目
- Python安装包 Acquisition-4.12-cp35-cp35m-win_amd64.whl.zip 使用说明
- Amaranthus-tuberculatus基因组分析脚本集
- Ubuntu 12.04下Realtek RTL8821AE驱动的向后移植指南
- 掌握Jest环境下的最新jsdom功能
- CAGI Toolkit:开源Asterisk PBX的AGI应用开发
- MyDropDemo: 体验QGraphicsView的拖放功能
- 远程FPGA平台上的Quartus II17.1 LCD色块闪烁现象解析