韩佳炜《数据挖掘:概念与技术》详解——数据仓库与挖掘方法
需积分: 50 40 浏览量
更新于2024-07-22
收藏 1.83MB PDF 举报
"《数据挖掘:概念与技术》是一本经典的IT领域教材,由韩佳炜编写,适用于南京大学研究生和西安电子科技大学本科学位三课程学习。该书由J.Han和M.Kamber合著,于2000年由Morgan Kaufmann出版社出版。本书主要探讨了数据挖掘的基础概念、技术以及其在实际中的应用。
在第一章中,作者首先阐述了数据挖掘的起源和重要性,解释了为何在海量数据中寻找有价值的信息成为必要。作者明确了数据挖掘的范畴,包括在关系数据库、数据仓库、事务数据库以及高级数据库系统中的应用。数据挖掘的功能被详细分类,如概念/类描述(特征和区分)、关联分析、分类和预测、聚类分析、局外者分析以及演变分析,强调并非所有模式都同等重要,需要根据实际需求筛选。
第二章深入讨论了数据仓库及其与操作数据库的区别,特别是多维数据模型,如星形、雪花和事实星座,以及度量的分类和计算。作者还介绍了OLAP(在线分析处理)技术在数据仓库中的关键作用,涉及系统结构、设计步骤、OLAP服务器类型比较,以及数据仓库的实现细节,如有效计算、索引优化和元数据管理。
第三章则着重于数据预处理的重要性,讲解了为什么在挖掘前需要对原始数据进行清洗、转换和集成,以确保数据的质量和适用性。这一阶段的工作包括处理缺失值、异常值、数据集成等,是数据挖掘流程中不可或缺的一环。
通过阅读这本书,读者能够掌握数据挖掘的基本概念、技术原理,以及如何在实践中构建和利用数据仓库进行深度分析。这对于理解现代商业智能和数据分析至关重要,有助于培养数据分析师和决策支持系统的开发者。"
2017-12-07 上传
2021-10-05 上传
2021-06-24 上传
2010-03-23 上传
2016-07-02 上传
xmisok
- 粉丝: 0
- 资源: 1
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜