Doris在小米数据中台的应用与场景分析

版权申诉
0 下载量 158 浏览量 更新于2024-08-12 收藏 202KB PDF 举报
"该文档介绍了Doris在小米数据中台中的应用情况,包括选择Doris的原因、Doris的系统类别、定位以及在小米数据中台中的作用。文档还提到了Doris适用于不同规模业务的场景,并对不适合Doris的场景进行了说明。最后,文档展望了Doris在云上的未来发展趋势,如弹性存储和计算资源管理等特性。" 正文: Doris是小米数据中台的重要组成部分,其在小米的数据处理中扮演了关键角色。小米选择Doris主要是因为其高压缩比、高性能查询以及低存储成本。这使得Doris在处理大量数据时能有效降低存储负担,同时提供快速的查询响应,满足了小米对于数据分析和BI的需求。 Doris的设计目标是为"数据分析"和"OLAP"服务,它在系统类别上属于交互处理,能够与Flink、SparkStreaming、Storm等实时计算框架以及MySQL等传统数据库协同工作。Doris的定位在于提供快速的在线分析处理能力,支持丰富的数据模型,具备动态分区和扩展性,可以通过HTTP接口进行操作,并且拥有丰富的运维工具,使得数据导入和管理更加便捷。 在小米数据中台的整体架构中,Doris主要负责数据分析和BI部分。数据经过离线计算和实时计算后,由Doris进行存储和处理,形成数据中台的核心能力。此外,数据中台还包括生命周期管理、数据质量管理、数据安全管理和多种数据服务,确保数据的有效利用和安全。 Doris在小米的应用主要分为两类场景:一是针对中、小、初创业务的灵活分析,这类场景强调低成本、灵活性和快速反馈,Doris的低成本和高灵活性使得它成为理想的解决方案。二是针对大型业务的固定指标分析,这类场景数据量大,需要预先计算好的指标,Doris的高效处理和稳定性能可以满足此类需求。 然而,Doris并不适合所有场景,例如在需要处理大规模明细数据并要求高度灵活性的场景下,由于并发量可能过大,Doris可能无法胜任。同时,如果应用场景并非数据分析,Doris的优势可能无法完全发挥。 对于未来的展望,Doris在云上的发展将更加强调弹性,包括弹性存储、Schema管理、数据管理以及索引管理等,以适应不断变化的业务需求。计算资源管理将更加智能化,物理执行计划和SQL优化也将得到提升,以提供更高效的服务。对外接口和协议的改进将进一步增强Doris的兼容性和易用性,使其在云环境下的数据处理能力更上一层楼。