数据挖掘:概念与技术 - 韩家炜经典著作
需积分: 10 149 浏览量
更新于2024-11-21
收藏 1.99MB PDF 举报
"《数据挖掘:概念与技术》是由韩家炜等编著的一本关于数据挖掘领域的经典著作。书中详细介绍了数据挖掘的基本概念、技术和应用,并涉及到数据仓库与OLAP技术的相关内容。"
在数据挖掘领域,《数据挖掘:概念与技术》是一本不可或缺的参考资料。作者韩家炜是该领域的知名专家,书中他与M. Kamber共同探讨了数据挖掘的核心问题。第一章介绍了数据挖掘的起源、重要性以及其在不同类型数据(如关系数据库、数据仓库、事务数据库和高级数据库系统)上的应用。此外,还阐述了数据挖掘的主要功能,包括概念描述、关联分析、分类预测、聚类分析、局外者分析和演变分析,强调并非所有模式都有实际价值。本章还讨论了数据挖掘系统的分类及其面临的主要挑战。
第二章深入到数据仓库和OLAP(在线分析处理)技术。数据仓库被定义为用于分析而非事务处理的分离数据库,区别于操作数据库。作者解释了多维数据模型,如星形、雪花和事实星座模式,以及度量、概念分层和OLAP操作。同时,探讨了数据仓库的系统结构,包括设计步骤、三层结构(ROLAP、MOLAP、HOLAP)的比较,以及数据仓库实现中的效率提升策略,如有效计算、索引、查询处理和元数据存储。章节末尾,作者指出数据仓库如何转化为数据挖掘的平台,从OLAP到OLAM(在线分析挖掘)的转变。
第三章关注数据预处理,这是数据挖掘过程中的重要环节。由于原始数据往往存在噪声、不一致性和缺失值等问题,预处理旨在提高数据质量,包括数据清洗、集成、转换和规约,以便后续的挖掘任务能够获得更准确和有意义的模式。
全书内容丰富,理论与实践相结合,适合对数据挖掘感兴趣的读者,无论是初学者还是专业人士,都能从中获取宝贵的见解和知识。通过阅读本书,读者将能全面理解数据挖掘的概念,掌握数据仓库与OLAP技术,并了解如何有效地进行数据预处理,为实际的数据挖掘项目奠定坚实基础。
2019-05-06 上传
2014-10-01 上传
2008-02-28 上传
726 浏览量
2018-02-05 上传
点击了解资源详情
点击了解资源详情
2024-11-27 上传
2024-11-27 上传
2024-11-27 上传
jjjscuedu
- 粉丝: 3
- 资源: 39
最新资源
- MATLAB新功能:Multi-frame ViewRGB制作彩色图阴影
- XKCD Substitutions 3-crx插件:创新的网页文字替换工具
- Python实现8位等离子效果开源项目plasma.py解读
- 维护商店移动应用:基于PhoneGap的移动API应用
- Laravel-Admin的Redis Manager扩展使用教程
- Jekyll代理主题使用指南及文件结构解析
- cPanel中PHP多版本插件的安装与配置指南
- 深入探讨React和Typescript在Alias kopio游戏中的应用
- node.js OSC服务器实现:Gibber消息转换技术解析
- 体验最新升级版的mdbootstrap pro 6.1.0组件库
- 超市盘点过机系统实现与delphi应用
- Boogle: 探索 Python 编程的 Boggle 仿制品
- C++实现的Physics2D简易2D物理模拟
- 傅里叶级数在分数阶微分积分计算中的应用与实现
- Windows Phone与PhoneGap应用隔离存储文件访问方法
- iso8601-interval-recurrence:掌握ISO8601日期范围与重复间隔检查