数据仓库与商业智能面试必备知识

3星 · 超过75%的资源 需积分: 46 80 下载量 136 浏览量 更新于2024-09-12 收藏 33KB DOCX 举报
"本文介绍了数据仓库和商业智能的相关面试题,涵盖了数据仓库的四大特点、四层体系结构,以及OLAP服务器的分类。同时,提到了前端工具的角色,特别是OLAP的概念,包括维的概念、基本多维操作、层次结构以及与OLTP的区别。" 在数据仓库领域,其四大特点构成了其核心特性: 1. 面向主题的:数据仓库是围绕某一特定业务领域或主题组织的,例如销售、客户或供应链,旨在支持特定业务决策。 2. 集成的:它将来自不同源的数据整合在一起,消除数据冗余,提供一致的数据视图。 3. 相对稳定的:数据仓库中的数据通常是静态的,不用于日常事务处理,而是用于分析和报告。 4. 反映历史变化的:数据仓库保留了数据的历史版本,允许用户追踪和分析数据随时间的变化。 数据仓库的四层体系结构包括: 1. 数据源:提供原始数据,可以是企业内部的RDBMS或其他系统。 2. 数据的存储与管理:这是数据仓库的核心,负责数据的抽取、清洗、转换和加载(ETL过程),并将数据按照主题域组织。 3. OLAP服务器:用于数据的多维分析,支持切片、 dice、钻取等操作,实现快速查询和分析。 - ROLAP(关系型在线分析处理)依赖于RDBMS进行数据存储和分析。 - MOLAP(多维在线分析处理)使用多维数据库,提供高效的聚合操作。 - HOLAP(混合型线上分析处理)结合了ROLAP和MOLAP的优点,将基础数据存储在RDBMS,聚合数据存储在多维数据库。 4. 前端工具:包括报表工具、查询工具、数据分析工具、数据挖掘工具等,帮助用户与数据仓库交互,生成报表和进行深度分析。 OLAP(联机分析处理)是数据仓库中的关键应用,主要用于决策支持。它以多维数据模型为基础,其中“维”是观察数据的不同角度,如时间、地区、产品等。维通常具有层次结构,允许用户在不同级别上进行分析。与OLTP(联机事务处理)相比,OLAP关注复杂分析而非日常交易,更注重性能和并发性,提供深度洞察而非快速更新。