Apache Kylin实战：从入门到精通

3星 · 超过75%的资源需积分: 48 163 浏览量更新于2024-09-13 4 收藏 1.35MB PDF 举报

"Apache Kylin操作使用教程" Apache Kylin是一个开源的、企业级的大数据分析工具，主要用于提供亚秒级的SQL查询性能在大数据集上。它设计的目标是为Hadoop环境提供一个简单、高性能的分析接口，使得业务分析师可以通过标准的SQL查询大规模的数据。Kylin与Hadoop、Hive、HBase等组件紧密集成，允许用户在海量数据上构建多维 OLAP（在线分析处理）立方体，从而实现快速的查询。 1. **概述** 在开始使用Kylin之前，你需要确保已有一个运行良好的Hadoop集群，并且Hive、HBase和Kylin都已安装并配置好。此外，Hive中应该已经有了你要分析的数据表。Kylin的工作流程主要包含五个步骤：创建工程、导入Hive元数据、建模、创建Cube以及数据可视化。 2. **界面总览** 安装完成后，通过`http://<服务器IP>:7070/kylin`访问Kylin的Web管理界面。使用默认的用户名和密码（ADMIN/KYLIN）登录，你可以看到已经创建的Cube和模型的界面总览。 3. **工程创建** 在Model界面，点击“新建Project”按钮，输入项目名称和描述，创建一个新的工程。 4. **HIVE表格元数据导入** 在 datasources 界面，你可以从Hive中导入你需要分析的表。输入表名（多表用逗号分隔），完成导入，之后可以在Kylin中看到这些表。 5. **Model创建** 切换到Models界面，新建Model并填写基本信息。接着，选择事实表和维度表，定义度量和日期列，完成Model的创建。如果需要修改已创建的Model，只需将鼠标悬停在Model名称上，点击编辑。 6. **Cube创建** 依然在Models界面，新建Cube，选择之前创建的Model，填充相关详细信息，如维度、度量等。设置Cube的刷新时间和高级设置，然后预览设置，确认无误后，启用Cube并开始构建。 7. **数据可视化** Cube构建完成后，你可以在Insight界面查看SQL查询结果，并进行数据的可视化分类查询。这使得用户能够直观地理解数据并进行深入分析。 Apache Kylin提供了一个强大的工具，用于在Hadoop环境中快速构建和查询大数据立方体，实现高效的数据分析。这个教程覆盖了从项目初始化到数据可视化的全过程，适合初学者了解和掌握Kylin的基本操作。通过实践，用户可以更好地理解和利用Kylin的强大功能，提升大数据分析的效率。

二界面总览

安装好 kylin 后，通过如下地址 http://<服务器 IP>:7070/kylin 可以进入 kylin 的网络管理

界面。

进入登录界面，输入用户名/密码：ADMIN/KYLIN

登陆以后，可以看到已经建立好的 cube 和相关的 model

界面总览

剩余11页未读，继续阅读

wxkrain

粉丝: 0
资源: 2

Apache Kylin实战：从入门到精通

全面掌握Apache Kylin：实战教程与数据分析技巧

Apache Kylin入门教程：亚秒级大数据分析

Apache Kylin 4.0大数据分析实战教程

Apache Kylin v3.1 使用教程.pdf

Apache Kylin快速入门教程【中文高清版】

Apache Kylin手动搭建与入门教程：配置与实践

Apache Kylin教程：实现超大数据的亚秒级查询

使用VMware构建Apache Kylin大数据OLAP靶机环境

Apache Kylin权威指南：大数据 OLAP 解决方案

Apache Kylin：超大规模数据的OLAP加速器

最新资源