数据挖掘入门:概念与技术探索
需积分: 6 49 浏览量
更新于2024-11-08
收藏 1.83MB PDF 举报
“计算机数据挖掘的电子书,作者韩家炜,DataMining:ConceptsandTechniques,出版年份2000,介绍了数据挖掘的基本概念、技术及其在数据仓库和OLAP技术中的应用。”
《计算机数据挖掘》这本书是数据科学领域的经典之作,由韩家炜等人撰写,它详细阐述了数据挖掘的原理与技术。书中的内容围绕数据挖掘的核心概念展开,旨在引导读者理解数据挖掘在大型数据集中的价值和作用。
在第一章“引言”中,作者提出数据挖掘是数据库技术自然演进的一部分,其重要性在于能从海量数据中发现有价值的信息。书中定义了数据挖掘,它主要在关系数据库、数据仓库、事务数据库及高级数据库系统中进行。数据挖掘的功能包括挖掘各种模式,如概念/类描述、关联分析、分类和预测、聚类分析、局外者分析和演变分析。作者还讨论了模式的有趣性标准,数据挖掘系统的分类以及面临的主要问题。
第二章“数据仓库和数据挖掘的OLAP技术”深入探讨了数据仓库的概念,区分了操作数据库系统和数据仓库的不同,解释了为何需要独立的数据仓库。多维数据模型的介绍涵盖了星形、雪花和事实星座等模式,以及度量、概念分层和OLAP操作。此外,还讨论了数据仓库的系统结构,包括三层结构,以及ROLAP、MOLAP、HOLAP的不同之处。章节末尾简述了数据仓库的实现,如有效计算、索引、查询处理和元数据存储。
第三章“数据预处理”是数据挖掘的关键步骤,因为原始数据往往需要清洗、转换和规范化,以便后续分析。预处理包括缺失值处理、异常值检测、数据集成、数据变换和归一化等,这些步骤确保了挖掘过程的准确性和有效性。
这本书是数据挖掘初学者和专业人士的宝贵参考资料,它不仅提供了理论基础,还涵盖了实践中的关键技术和工具,帮助读者理解和应用数据挖掘技术解决实际问题。通过阅读本书,读者可以系统地掌握数据挖掘的全貌,包括其在数据仓库和OLAP环境中的应用,以及数据预处理的重要性。
2008-10-13 上传
2021-07-14 上传
2008-04-02 上传
2023-12-30 上传
2023-05-24 上传
2023-02-17 上传
2023-05-24 上传
2024-01-06 上传
2023-05-30 上传
fafa009
- 粉丝: 1
- 资源: 6
最新资源
- Android应用源码之写的google map api 应用.zip项目安卓应用源码下载
- AdvExpFig:导出 MATLAB 图-matlab开发
- SuperChangelog:超级变更日志插件的源代码
- death_calc_version2
- hw_python_oop
- LX-PWM,ev3程序怎么看c语言源码,c语言程序
- material-typeahead-sample
- 基于Linux、QT、C++的“别踩白块儿”小游戏
- physx-js:PhysX for JavaScript
- 提取均值信号特征的matlab代码-First_unofficial_entry_2021:First_unofficial_entry_20
- Siege_solution_website
- ecf-2021-jd
- number.github.io:通过Szymon Rutyna
- Kinesys-RenPy-Practice:RenPy制作游戏
- Ad,c语言源码反码补码转换代码,c语言程序
- vgrid:具有魔术媒体查询混合功能的可变SCSS网格系统