韩家炜《数据挖掘:概念与技术》解析
需积分: 50 95 浏览量
更新于2024-07-23
收藏 1.83MB PDF 举报
"《数据挖掘》是韩家炜撰写的一本深入探讨数据挖掘领域的著作,书中详尽地阐述了该领域的基础知识和实际应用。作者J.Han和M.Kamber合作,由Morgan Kaufmann出版社于2000年出版。本书涵盖了从数据挖掘的基本概念、技术到实际操作中的数据仓库和OLAP技术,再到数据预处理的重要环节。"
在第一章“引言”中,韩家炜首先解释了数据挖掘的兴起及其重要性,强调它在海量数据中寻找有价值信息的关键作用。接着,他界定了数据挖掘的定义,讨论了在不同类型的数据源(如关系数据库、数据仓库、事务数据库和高级数据库系统)上进行挖掘的可能性。此外,本章还列举了数据挖掘的主要功能,包括概念描述、关联分析、分类预测、聚类分析、局外者分析和演变分析,并提出了模式的有趣性问题以及数据挖掘系统的分类。最后,讨论了数据挖掘面临的主要挑战。
第二章“数据仓库和数据挖掘的OLAP技术”深入探讨了数据仓库的概念,对比了操作数据库系统与数据仓库的差异,强调了数据仓库作为决策支持系统的核心角色。本章介绍了多维数据模型,包括星形、雪花和事实星座模式,以及度量、分层和OLAP操作。还详细讨论了数据仓库的系统结构,如三层架构,比较了ROLAP、MOLAP和HOLAP的不同,并涉及数据仓库的实现技术,如数据立方体的有效计算、索引、查询处理和元数据存储。最后,章节展望了数据仓库向数据挖掘的演进,提出了OLAP到OLAP Mining的转变。
第三章“数据预处理”讨论了在进行数据挖掘之前对原始数据进行清洗、转换和规范化的重要性,因为原始数据往往存在噪声、缺失值和不一致性等问题。这一章将详细阐述预处理过程中的各种技术,如数据清洗、集成、转换和规范化,这些步骤对于确保挖掘出的模式的质量和可靠性至关重要。
《数据挖掘:概念与技术》是数据科学领域的一部经典教材,它为读者提供了全面的理解和实践数据挖掘的坚实基础,涵盖了从理论到实际应用的各个方面,对于想要深入了解数据挖掘的读者来说,是一本不可多得的参考书籍。
2019-05-06 上传
2018-02-05 上传
2014-10-01 上传
点击了解资源详情
点击了解资源详情
2012-07-06 上传
2008-02-28 上传
2018-08-14 上传
2010-06-22 上传
朝夕0803
- 粉丝: 0
- 资源: 3
最新资源
- 构建基于Django和Stripe的SaaS应用教程
- Symfony2框架打造的RESTful问答系统icare-server
- 蓝桥杯Python试题解析与答案题库
- Go语言实现NWA到WAV文件格式转换工具
- 基于Django的医患管理系统应用
- Jenkins工作流插件开发指南:支持Workflow Python模块
- Java红酒网站项目源码解析与系统开源介绍
- Underworld Exporter资产定义文件详解
- Java版Crash Bandicoot资源库:逆向工程与源码分享
- Spring Boot Starter 自动IP计数功能实现指南
- 我的世界牛顿物理学模组深入解析
- STM32单片机工程创建详解与模板应用
- GDG堪萨斯城代码实验室:离子与火力基地示例应用
- Android Capstone项目:实现Potlatch服务器与OAuth2.0认证
- Cbit类:简化计算封装与异步任务处理
- Java8兼容的FullContact API Java客户端库介绍