数据挖掘:概念、技术与数据仓库的探索
需积分: 33 89 浏览量
更新于2024-09-24
收藏 1.83MB PDF 举报
"数据挖掘概念与技术 韩加玮"
本书是数据挖掘领域的经典之作,由韩加玮撰写,基于J.Han和M.Kamber的《DataMining: Concepts and Techniques》进行阐述。这本书深入探讨了数据挖掘的重要性和基本概念,以及相关技术的应用。
在第一章“引言”中,作者首先提出数据挖掘的起源和重要性,指出数据挖掘是应对海量数据中隐藏价值的关键手段。接着,他详细解释了数据挖掘的定义,强调它可以在各种类型的数据集上进行,如关系数据库、数据仓库、事务数据库和高级数据库系统。书中还介绍了数据挖掘的主要功能,包括概念/类描述、关联分析、分类和预测、聚类分析、局外者分析以及演变分析。作者讨论了模式的有趣性,并对数据挖掘系统进行了分类,同时概述了数据挖掘面临的主要问题。
第二章“数据仓库和数据挖掘的OLAP技术”中,作者详细阐述了数据仓库的基本概念,对比了操作数据库系统与数据仓库的差异,解释了为何需要独立的数据仓库。多维数据模型被介绍,包括星形、雪花和事实星座等模式,以及度量、概念分层和OLAP(在线分析处理)操作。此外,还探讨了数据仓库的系统结构,包括三层架构、不同类型的OLAP服务器(ROLAP、MOLAP、HOLAP)以及数据仓库的实现技术,如有效计算、索引、查询处理和元数据存储。最后,作者提到了数据仓库向数据挖掘的演进,即从OLAP到OLAP挖掘。
第三章“数据预处理”着重讨论了在数据挖掘之前必须进行的数据清洗、转换和规范化,因为原始数据往往含有噪声、不一致性和缺失值,预处理是提高数据挖掘结果质量的关键步骤。
本书内容丰富,涵盖了数据挖掘的理论基础和实践应用,对于想要深入理解和掌握数据挖掘技术的读者来说,是一本非常有价值的参考书。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2016-02-28 上传
2010-04-01 上传
Springever
- 粉丝: 3
- 资源: 4
最新资源
- C语言数组操作:高度检查器编程实践
- 基于Swift开发的嘉定单车LBS iOS应用项目解析
- 钗头凤声乐表演的二度创作分析报告
- 分布式数据库特训营全套教程资料
- JavaScript开发者Robert Bindar的博客平台
- MATLAB投影寻踪代码教程及文件解压缩指南
- HTML5拖放实现的RPSLS游戏教程
- HT://Dig引擎接口,Ampoliros开源模块应用
- 全面探测服务器性能与PHP环境的iprober PHP探针v0.024
- 新版提醒应用v2:基于MongoDB的数据存储
- 《我的世界》东方大陆1.12.2材质包深度体验
- Hypercore Promisifier: JavaScript中的回调转换为Promise包装器
- 探索开源项目Artifice:Slyme脚本与技巧游戏
- Matlab机器人学习代码解析与笔记分享
- 查尔默斯大学计算物理作业HP2解析
- GitHub问题管理新工具:GIRA-crx插件介绍