数据,而是经过加工、清洗、集成、汇总和统一的数据。 面对大数据的数据仓库系统全文共45页,当前为第8页。 数据仓库概述 数据仓库的内涵 1. 支持多种数据源 数据仓库应支持多种数据源,不仅仅是数据库,还应有各种数据文件、文本文件、应用程序等。 2. 不只存放数据 数据仓库中存放的应该不仅是供分析使用的数据,还应有在一 激发条件下能主动起作用的处理规则、算法、甚至是过程。 3. 虚拟数据仓库 传统的物理数据仓库方法并非唯一的选择,应根据需求的具体情况,建立虚拟数据仓库的解决方案。 4. 汇总并统一 据仓库中的数据并不完全是原始数据,而是经过加工、清洗、集成、汇总和统一的数据。 面对大数据的数据仓库系统全文共45页,当前为第9页。 分布式数据仓库系统 1. 何为分布式数据仓库 简单点说,如果数据仓库要支持企业中大量、分散、异构的数据源,就要使用分布式数据仓库。 2. 分布式数据库技术综述 分布式数据库技术是一种特殊的数据库技术,它集成了多个相对独立的数据库系统。 3. 分布式数据库管理系统 市场上已经出现许多种类的分布式数据库管理系统(DBMS),例如MySQL Cluster、PostgreSQL等。 4. 分布式数据仓库系统的优点 分布式数据仓库系统的优点主要表现在两个方面,其一是可以实现数据的分布式存储,其二是支持分布式计算。 面对大数据的数据仓库系统全文共45页,当前为第10页。 内存数据仓库系统 1. 何为内存数据仓库 内存数据仓库就是依靠内存来完成数据存储与数据分析的数据库系统。 2. 内存数据库系统与传统数据库系统的区别 内存数据库系统与传统数据库系统在系统结构、存储结构、索引结构等方面都有一定的不同。 3. 内存数据库的特点 内存数据库的最大特点就是速度快,它可以将数据存储在内存中,从而克服了传统磁盘I/O的低效率。 4. 内存数据库在大数据环境下的应用 内存数据库在大数据环境下的应用主要表现在高速读写及即时处理大数据量。 面对大数据的数据仓库系统全文共45页,当前为第11页。 本模板由演示宝pconline制作 www.pconline.com.cn 资料来自《大数据分析·原理与实践》 更多资料请关注微信公众号:演示宝-大数据 分布式 数据仓库 内存 数据仓库.
评论0