没有合适的资源?快使用搜索试试~ 我知道了~
首页数据仓库基础:入门与实践
数据仓库基础:入门与实践
需积分: 9 12 下载量 126 浏览量
更新于2024-07-25
收藏 1.34MB PDF 举报
"数据仓库基础中文版是一本专为初学者和有经验的IT从业者设计的数据仓库教科书,由Paulraj Ponniah博士撰写。该书填补了数据仓库教育领域的空白,尤其适合大学教授和学生使用。书中内容涵盖了数据仓库的基础知识,包括逻辑结构、设计到应用的过渡,以及最新的行业趋势。书中的每个章节都有清晰的结构,连贯的主题,必要的基础知识,并配有复习问题和练习,有助于学习和教学。作者的写作风格清晰流畅,使得这本书易于理解和接受。这本书对于想要深入了解数据仓库的专业人士来说是一份宝贵的资源。"
在这本书中,读者可以期待学习以下关键知识点:
1. 数据仓库的定义和概念:了解数据仓库的基本原理,它是如何从操作型数据库中分离出来,用于支持决策分析的。
2. 数据仓库的架构:探索数据仓库的不同层次,如源系统、ETL(抽取、转换、加载)、数据存储和前端工具。
3. 数据模型设计:学习如何构建星型、雪花型或其他数据模型,以优化分析性能。
4. 数据清洗和转换:理解数据预处理的重要性,包括数据质量检查、异常处理和数据标准化。
5. 数据仓库的实施:了解数据仓库项目的生命周期,从需求分析到系统部署的各个阶段。
6. OLAP(在线分析处理)和多维分析:掌握多维数据结构的概念,如立方体和切片,以及如何进行深入的业务洞察。
7. 数据仓库的最新趋势:学习Hadoop、大数据和云数据仓库等现代技术在数据仓库中的应用。
8. 实践应用和案例研究:通过实际案例加深对理论知识的理解,了解数据仓库在不同行业中的应用。
9. 复习问题和练习:通过书中的习题巩固学习,提高解决实际问题的能力。
这本书不仅适用于大学数据仓库课程,也适合自我学习和职业发展,无论你是初次接触数据仓库还是希望提升专业技能,都能从中获益。Ponniah博士的著作以其全面性和实用性,将成为数据仓库学习者的宝贵参考资料。
16
谁应该负责?...............................................................................................................316
净化过程.......................................................................................................................317
对数据质量的实用建议...............................................................................................319
本章总结...............................................................................................................................319
思考题...................................................................................................................................320
复习题...................................................................................................................................320
第十四章 信息和用户类型之间的匹配...................................................................................322
本章目标...............................................................................................................................322
数据仓库的信息...................................................................................................................323
数据仓库 VS 操作型系统....................................................................................................323
信息潜力.......................................................................................................................325
全面的企业管理...........................................................................................................325
在商业领域的信息潜力...............................................................................................326
用户信息接口...............................................................................................................327
信息使用模式...............................................................................................................327
行业应用...............................................................................................................................329
谁将使用这些信息?...................................................................................................330
用户的种类...................................................................................................................330
他们需要什么...............................................................................................................332
怎样为用户提供信息...................................................................................................336
信息传送机制.......................................................................................................................337
查询...............................................................................................................................337
报表...............................................................................................................................339
应用系统.......................................................................................................................341
信息传送工具.......................................................................................................................341
桌上型电脑环境...........................................................................................................342
工具选择的方法学.......................................................................................................342
选择工具的标准...........................................................................................................345
信息传送框架.......................................................................................................................347
本章总结...............................................................................................................................347
17
思考题...................................................................................................................................348
复习题...................................................................................................................................348
第十五章 数据仓库中的联机分析处理(OLAP)......................................................................350
本章目标...............................................................................................................................350
联机分析处理的要求...........................................................................................................351
对多维分析的需要.......................................................................................................351
快速的访问和强大的计算...........................................................................................352
其它分析方法的局限性...............................................................................................354
联机分析处理(OLAP)是用户需要的答案 ............................................................356
OLAP 的定义和规则 ...........................................................................................................357
OLAP 特征 ...................................................................................................................359
主要的特征和功能...............................................................................................................359
一般的特征...................................................................................................................360
维度分析.......................................................................................................................360
什么是超立方体?.......................................................................................................363
下钻和概括化的操作...................................................................................................364
多层次/多视角查看或旋转的操作..............................................................................365
OLAP 的使用和从中获得的好处 ...............................................................................366
OLAP 模型 ...........................................................................................................................366
变种的概述...................................................................................................................367
MOLAP 模型................................................................................................................367
ROLAP 模型.................................................................................................................368
ROLAP VS MOLAP.....................................................................................................368
OLAP 执行的考虑事项 .......................................................................................................369
数据设计和准备...........................................................................................................369
管理和性能...................................................................................................................371
OLAP 平台 ...................................................................................................................373
OLAP 工具和产品 .......................................................................................................374
执行步骤.......................................................................................................................375
本章总结...............................................................................................................................375
18
思考题...................................................................................................................................376
练习题...................................................................................................................................376
第十六章 数据仓库和 Web ......................................................................................................378
本章目标...............................................................................................................................378
支持 Web 的数据仓库 .........................................................................................................379
为什么是 Web? ..........................................................................................................379
技术的结合...................................................................................................................381
调整数据仓库使它能够支持 Web...............................................................................382
作为数据源的 Web ......................................................................................................383
基于 Web 的信息传送机制 .................................................................................................384
扩展了数据仓库的使用...............................................................................................384
新的信息策略...............................................................................................................386
数据仓库的浏览器技术...............................................................................................388
安全问题.......................................................................................................................390
OLAP 和 Web.......................................................................................................................390
企业 OLAP ...................................................................................................................390
Web-OLAP 方法...........................................................................................................391
OLAP 引擎的设计 .......................................................................................................391
建立一个支持 Web 的数据仓库..........................................................................................392
数据仓库的本质...........................................................................................................393
对如何实现数据仓库的考虑.......................................................................................394
将组件放在一起...........................................................................................................395
Web 处理模型 ..............................................................................................................396
本章总结...............................................................................................................................396
思考题...................................................................................................................................397
练习题...................................................................................................................................397
第十七章 数据挖掘基础...........................................................................................................399
本章目标...............................................................................................................................399
数据挖掘是什么?...............................................................................................................400
定义数据挖掘...............................................................................................................400
19
知识发现过程...............................................................................................................401
OLAP VS 数据挖掘 ............................................................................................................403
数据挖掘和数据仓库...........................................................................................................404
主要的数据挖掘技术...........................................................................................................405
聚类(cluster)............................................................................................................406
决策树...........................................................................................................................408
基于记忆的推理...........................................................................................................409
关联分析.......................................................................................................................410
神经网络.......................................................................................................................411
遗传算法.......................................................................................................................412
进入数据挖掘...............................................................................................................413
数据挖掘应用程序...............................................................................................................415
数据挖掘的收益...........................................................................................................416
在零售业的应用...........................................................................................................417
在通信行业上的应用...................................................................................................418
在银行和金融业的应用...............................................................................................419
本章总结...............................................................................................................................419
思考题...................................................................................................................................420
练习题...................................................................................................................................420
第十八章 物理设计过程...........................................................................................................422
本章目标...............................................................................................................................422
物理设计步骤.......................................................................................................................422
建立规范.......................................................................................................................423
建立聚集计划...............................................................................................................423
确定数据分区方案.......................................................................................................424
建立聚簇选项...............................................................................................................424
准备索引策略...............................................................................................................425
安排存储结构...............................................................................................................425
完成物理建模...............................................................................................................426
物理设计要点.......................................................................................................................426
20
物理设计目标...............................................................................................................426
物理模型的组成...........................................................................................................428
规范的意义...........................................................................................................................429
数据库对象的命名.......................................................................................................429
物理存储.......................................................................................................................431
存储区数据结构...........................................................................................................431
优化存储.......................................................................................................................432
使用 RAID 技术...........................................................................................................434
数据仓库索引.......................................................................................................................435
索引一览.......................................................................................................................435
B-Tree 索引 ..................................................................................................................437
位图索引.......................................................................................................................437
簇索引...........................................................................................................................438
索引事实表...................................................................................................................438
维表索引.......................................................................................................................439
提高性能的技术...................................................................................................................439
数据分区.......................................................................................................................440
数据聚簇.......................................................................................................................441
并行查询.......................................................................................................................441
汇总级别.......................................................................................................................442
参考一致性检查...........................................................................................................442
初始化参数...................................................................................................................442
本章总结...............................................................................................................................443
思考题...................................................................................................................................443
练习题...................................................................................................................................444
第十九章 数据仓库部署...........................................................................................................445
本章目标...............................................................................................................................445
部署的主要任务...................................................................................................................446
完成用户接受...............................................................................................................446
执行初始加载...............................................................................................................447
剩余482页未读,继续阅读
点击了解资源详情
点击了解资源详情
点击了解资源详情
2013-09-27 上传
2010-03-13 上传
2009-01-07 上传
2008-08-22 上传
2015-10-25 上传
2011-08-17 上传
Guo_Yishan
- 粉丝: 0
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 深入浅出:自定义 Grunt 任务的实践指南
- 网络物理突变工具的多点路径规划实现与分析
- multifeed: 实现多作者间的超核心共享与同步技术
- C++商品交易系统实习项目详细要求
- macOS系统Python模块whl包安装教程
- 掌握fullstackJS:构建React框架与快速开发应用
- React-Purify: 实现React组件纯净方法的工具介绍
- deck.js:构建现代HTML演示的JavaScript库
- nunn:现代C++17实现的机器学习库开源项目
- Python安装包 Acquisition-4.12-cp35-cp35m-win_amd64.whl.zip 使用说明
- Amaranthus-tuberculatus基因组分析脚本集
- Ubuntu 12.04下Realtek RTL8821AE驱动的向后移植指南
- 掌握Jest环境下的最新jsdom功能
- CAGI Toolkit:开源Asterisk PBX的AGI应用开发
- MyDropDemo: 体验QGraphicsView的拖放功能
- 远程FPGA平台上的Quartus II17.1 LCD色块闪烁现象解析
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功