Apache Doris:从OLAP引擎到全能数据分析平台的演进与技术亮点

5星 · 超过95%的资源 需积分: 28 44 下载量 106 浏览量 更新于2024-08-04 收藏 334KB PPTX 举报
Apache Doris,原名为百度的PALO,起源于2012年,作为公司的首个OLAP分析平台。自那时以来,经过不断的演进和社区的推动,Doris在2020年取得了显著的成长,荣获多项开源大奖,如“最佳人气项目”、“十大开源新锐项目”和“中国开源项目Top10”,表明其在开源社区中的活跃度和认可度提升。 作为一款基于MPP架构的高性能实时分析引擎,Doris以其亚秒级的查询响应时间和高并发支持能力而闻名。它不仅适用于高吞吐量的点查询,还能够处理复杂的分析场景,使得实时仪表板、分析师报告以及面向用户或客户的报表分析成为可能。Doris致力于提供以分析师为中心的自助服务分析环境,支持不规则查询模式和对数据科学及机器学习的需求。 随着技术发展,Doris的设计目标不断调整,最初专注于满足专用系统的统计分析,随后扩展到通用报表和数据可视化。现在,用户的需求主要集中在BI分析(50%)、半结构化数据搜索分析(20-30%)以及数据科学和机器学习应用(20-30%)。为了更好地支持这些需求,Doris正在向更全面的解决方案转型,一方面强化原有的在线结构化数据处理性能,借鉴ClickHouse的优秀设计,提升实时化、存储和计算性能;另一方面,通过扩展对半结构化数据的支持,挑战像Elasticsearch在日志分析领域的地位。 Doris的定位不再局限于传统的在线数据仓库,而是形成了一个“一纵两横”的格局,即纵向深化在线分析性能,横向扩展至实时性和半结构化数据处理能力。这种转变使得Doris成为一个更为全面的平台,适应日益多样化的数据分析场景,不仅满足 BI 需求,还能处理日志分析和数据科学任务,展现出强大的适应性和灵活性。