Apache Kylin与HBase：大数据OLAP引擎实战

需积分: 5 121 浏览量更新于2024-07-17 收藏 950KB PDF 举报

"Apache Kylin on HBase 是一个关于如何在HBase上使用Apache Kylin进行大数据OLAP处理的文档，由Apache Kylin的Committer和PMC成员史少锋于2018年8月17日发布。文档介绍了Apache Kylin的基本概念、架构、选择HBase作为存储引擎的原因，以及如何在OLAP中使用HBase，同时还分享了Apache Kylin的一些典型应用场景。" Apache Kylin是一个开源的、面向大数据的极端快速在线分析处理（OLAP）引擎，它设计的目标是处理万亿级的数据行，并能在亚秒级别内响应查询。其主要特点包括易用性、实时交互性、对ANSI SQL的支持以及与Hadoop的原生集成。 1. 易用性：Apache Kylin提供了一个用户友好的Web图形界面，无需编程即可操作。它支持JDBC、ODBC、REST API，能无缝集成Tableau、MicroStrategy（MSTR）、Qlik Sense、Power BI、Excel等商业智能工具，极大地拓宽了其应用范围。 2. 实时交互性：Kylin可以在万亿级别的数据中实现99%的查询在1.3秒内完成，这在Meituan.com的实际应用中得到了验证。 3. ANSI SQL支持：Apache Kylin提供了在Hadoop上的SQL支持，能够处理大部分ANSI SQL查询函数，使得数据分析师可以使用熟悉的SQL语法进行大数据分析。 4. Hadoop原生：Kylin与MapReduce、Spark、HBase紧密集成，采用完全可扩展的架构。计算和数据存储都发生在Hadoop生态系统中，确保了系统的可伸缩性。 5. 多维立方体（MOLAP Cube）：用户可以定义数据模型并预先在Kylin中构建，即使原始数据记录超过100亿条，也能保证高效的查询性能。 Apache Kylin的架构是基于Hadoop的，实现了水平扩展，它作为大数据BI工具，能够处理大量数据并提供快速的分析能力。Kylin的工作原理主要是通过预计算（即构建立方体）来优化查询性能，将复杂的多表联接和聚合操作转化为对预计算结果的简单查找，从而极大地缩短了查询时间。在实际应用中，Apache Kylin常用于电商、金融、电信等行业，例如进行销售分析、用户行为分析、市场趋势预测等。它能够在大规模数据集上提供即时的分析洞察，帮助企业做出快速决策。通过与HBase的结合，Kylin能够利用HBase的分布式存储能力，进一步提高数据处理的效率和稳定性。

What is Apache Kylin

Key characters

Ease of Use

No programing; User-friendly Web GUI;

Seamless BI Integration

JDBC/ODBC/REST API; Supports Tableau, MSTR, Qlik

Sense, Power BI, Excel and others

Real Interactive

Trillion rows data, 99% queries < 1.3 seconds,

from Meituan.com

ANSI-SQL

SQL on Hadoop, supports most ANSI SQL

query functions

Hadoop Native

Compute and store data with

MapReduce/Spark/HBase, fully scalable architecture;

MOLAP Cube

User can define a data model and pre-build in Kylin

with more than 10+ billions of raw data records

剩余24页未读，继续阅读

weixin_38744270

粉丝: 329
资源: 2万+

Apache Kylin与HBase：大数据OLAP引擎实战

基于springboot的在线答疑系统文件源码（java毕业设计完整源码+LW）.zip

最简单，最实用的数据库文档生成工具，支持SqlServer/MySQL/Oracle/PostgreSQL/DB2/SQLite数据库

基于springboot的微服务的旅行社门店系统的设计实现源码（java毕业设计完整源码+LW）.zip

“书籍导航”：构建高效的图书管理系统

电子手轮Ver1.1（位置跟随，X轴或Y轴） 1.200smart、威纶通触摸屏 2.手轮或编码器+PLC+伺服驱动器 3.手轮接入PLC，伺服接Q0.0或Q0.1，手轮转动，伺服电机准确跟随 4

wzb剧集爬虫程序代码1.txt

(180384612)Python数据结构与算法-PPT课件.rar

收到防护服快快快啊啊啊啊啊

西门子s7 200smart与3台欧姆龙E5cc温控器通讯控 功能：可以直接应用现场 实现西门子s7 200smart对3台欧姆龙E5cc温控器进行485通讯控制，在触摸屏上设定温度，读取温度，设定探

光伏-电池充电模型，可以很好的稳定直流输出电压 采用最大功率跟踪MPPT算法，通过boost电路输出电压，电池侧采用电压电流PI双闭环控制，通过双向电路给电池充放电 直流侧参考电压为48v

最新资源

西门子s7 200smart与3台欧姆龙E5cc温控器通讯控功能：可以直接应用现场实现西门子s7 200smart对3台欧姆龙E5cc温控器进行485通讯控制，在触摸屏上设定温度，读取温度，设定探

光伏-电池充电模型，可以很好的稳定直流输出电压采用最大功率跟踪MPPT算法，通过boost电路输出电压，电池侧采用电压电流PI双闭环控制，通过双向电路给电池充放电直流侧参考电压为48v