韩家炜著作:数据挖掘入门与数据仓库技术详解

需积分: 50 0 下载量 51 浏览量 更新于2024-07-28 收藏 1.83MB PDF 举报
"《韩家炜--数据挖掘:概念与技术》是一本针对数据挖掘初学者的权威教材,由知名作者韩家炜与M.Kamber合作编写,于2000年由Morgan Kaufmann出版社出版。本书旨在提供全面的数据挖掘基础知识,引导读者理解数据挖掘的重要性和应用领域。 在第一章,作者首先阐述了数据挖掘的起源和其重要性,解释了数据挖掘不仅仅是寻找隐藏在大量数据中的模式,而是通过对各类数据源(如关系数据库、数据仓库、事务数据库等)的深入分析,挖掘出概念描述、关联规则、分类预测、聚类分析、局外者检测以及演变分析等不同类型的信息。作者强调并非所有模式都具有实际价值,需要根据业务需求来判断。 第二章聚焦于数据仓库和OLAP(在线分析处理)技术,这是数据挖掘的基础环境。作者详细讲解了数据仓库的概念,对比了操作型数据库系统和数据仓库的差异,介绍了多维数据模型,如星形、雪花和事实星座,以及度量的分类和计算。此外,还讨论了数据仓库的系统结构,包括设计步骤、层次化结构和不同类型的OLAP服务器(如ROLAP、MOLAP和HOLAP)。 第三章深入探讨数据预处理的重要性,解释了为什么数据在挖掘前需要经过清洗、转换和集成等步骤,以确保数据的质量和适用性。这包括处理缺失值、异常值、数据集成、数据规约等关键环节。 全书以实践为导向,理论与实例相结合,适合那些希望系统掌握数据挖掘基础概念和技术的读者,不仅有助于理解数据挖掘的基本原理,也为后续在实际项目中运用数据挖掘提供了坚实的基础。通过阅读这本书,读者将建立起对数据挖掘流程的全面认知,并能熟练运用数据仓库工具和技术进行数据挖掘工作。"