数据挖掘:概念与技术 - 韩家炜中文版概览
4星 · 超过85%的资源 需积分: 35 32 浏览量
更新于2024-12-22
2
收藏 1.83MB PDF 举报
"数据挖掘 概念与技术 by 韩家炜 中文版"
《数据挖掘:概念与技术》是韩家炜教授所著的一本关于数据挖掘的经典教材,其英文版名为"Data Mining: Concepts and Techiniques",由J. Han和M. Kamber共同撰写,并由Morgan Kaufmann在2000年出版。本书深入浅出地介绍了数据挖掘领域的核心概念和技术,是学习数据挖掘的宝贵资料。
在第一章“引言”中,作者首先阐述了数据挖掘的重要性和兴起的原因,指出数据挖掘是面对海量数据时寻找有价值信息的关键方法。接着,定义了数据挖掘这一术语,强调它主要应用于关系数据库、数据仓库、事务数据库以及高级数据库系统和应用。书中还列举了数据挖掘的六大功能:概念/类描述、关联分析、分类与预测、聚类分析、局外者分析以及演变分析,探讨了模式的有趣性以及数据挖掘系统的分类。此外,作者还讨论了数据挖掘面临的主要问题,如数据质量、噪声和异常值的处理等。
第二章“数据仓库和数据挖掘的OLAP技术”深入介绍了数据仓库的基本概念,包括操作数据库系统与数据仓库的区别、数据仓库的需求以及多维数据模型。其中,详细讨论了星形、雪花和事实星座等多维数据库模式,以及度量、概念分层和OLAP操作。此外,还涉及数据仓库的系统结构,如三层结构、不同类型的OLAP服务器(ROLAP、MOLAP、HOLAP)的比较,以及数据仓库的实现技术,如数据立方体的有效计算、索引、查询处理和元数据存储。
第三章“数据预处理”是数据挖掘的重要环节,作者强调了预处理的必要性,因为原始数据往往存在缺失值、不一致性、噪声等问题,需要通过清洗、转换和规约等步骤来提高数据的质量,从而提升数据挖掘的结果。这部分可能涵盖数据清洗、数据集成、数据变换、数据规约等多个方面。
这本教材通过丰富的实例和详尽的解释,帮助读者理解和掌握数据挖掘的核心概念和关键技术,是数据科学领域的重要参考资料,适合于学生、研究人员以及对数据挖掘感兴趣的从业者学习使用。
2018-02-05 上传
2010-04-01 上传
点击了解资源详情
2016-02-28 上传
2010-01-28 上传
2010-06-22 上传
2008-02-28 上传
2012-07-06 上传
点击了解资源详情
anbindear
- 粉丝: 0
- 资源: 7
最新资源
- Java毕业设计项目:校园二手交易网站开发指南
- Blaseball Plus插件开发与构建教程
- Deno Express:模仿Node.js Express的Deno Web服务器解决方案
- coc-snippets: 强化coc.nvim代码片段体验
- Java面向对象编程语言特性解析与学生信息管理系统开发
- 掌握Java实现硬盘链接技术:LinkDisks深度解析
- 基于Springboot和Vue的Java网盘系统开发
- jMonkeyEngine3 SDK:Netbeans集成的3D应用开发利器
- Python家庭作业指南与实践技巧
- Java企业级Web项目实践指南
- Eureka注册中心与Go客户端使用指南
- TsinghuaNet客户端:跨平台校园网联网解决方案
- 掌握lazycsv:C++中高效解析CSV文件的单头库
- FSDAF遥感影像时空融合python实现教程
- Envato Markets分析工具扩展:监控销售与评论
- Kotlin实现NumPy绑定:提升数组数据处理性能