数据挖掘入门:概念、技术与挑战
需积分: 35 85 浏览量
更新于2024-11-09
收藏 1.83MB PDF 举报
“数据挖掘-技术与概念.pdf”是一本关于数据挖掘基础知识的导论书籍,由韩家炜和M. Kamber合著,出版于2000年,由Morgan Kaufmann出版社发行。这本书主要从数据库的角度探讨数据挖掘的概念和技术,重点关注在大规模数据集中发现有趣模式的过程。书中涉及了数据挖掘的重要性、数据挖掘的种类、可以挖掘的模式类型、数据挖掘系统的一般结构,以及数据预处理等关键议题。
在第一章节中,作者阐述了数据挖掘的起源和重要性,指出数据挖掘是数据库技术演进的一个自然部分。他们解释了数据挖掘可以在各种类型的数据集上进行,如关系数据库、数据仓库、事务数据库以及高级数据库系统和应用。数据挖掘的功能包括寻找概念描述、关联规则、分类、预测、聚类、局外者分析以及演变分析。作者还讨论了模式的筛选问题,指出并非所有模式都有用,以及数据挖掘系统的主要挑战。
第二章深入讲解了数据仓库和在线分析处理(OLAP)技术。数据仓库是支持决策分析的集成化、非易失性数据集合,与操作数据库系统有显著区别。作者介绍了多维数据模型,如星形、雪花和事实星座模式,以及度量、概念分层和OLAP操作。此外,还讨论了数据仓库的系统结构,包括设计步骤、三层结构(即源系统、数据仓库服务器和前端工具),以及不同类型的OLAP服务器(ROLAP、MOLAP、HOLAP)的比较。章节结尾,作者展望了数据仓库技术的未来发展方向,如数据立方体的自发现和多粒度聚合。
第三章探讨了数据预处理,这是数据挖掘过程中的重要环节,因为原始数据往往需要清洗、转换和规范化才能用于有效的挖掘。预处理包括处理缺失值、异常值、噪声和不一致性,以及数据规范化、归一化、离群值检测和数据集成。这部分内容强调了预处理对于提高挖掘结果质量和效率的关键作用。
这本书涵盖了数据挖掘的基础理论、数据仓库的设计与实现,以及预处理技术,是理解和实践数据挖掘技术的宝贵资源。通过学习,读者可以掌握数据挖掘的基本概念,理解其在现代信息处理中的核心地位,以及如何利用这些技术从海量数据中提取有价值的知识。
2010-07-30 上传
2018-10-30 上传
2019-09-14 上传
2023-07-27 上传
2022-06-28 上传
2023-11-10 上传
2023-04-09 上传
2021-09-03 上传
2022-06-29 上传
痴迷人
- 粉丝: 4
- 资源: 11
最新资源
- Java集合ArrayList实现字符串管理及效果展示
- 实现2D3D相机拾取射线的关键技术
- LiveLy-公寓管理门户:创新体验与技术实现
- 易语言打造的快捷禁止程序运行小工具
- Microgateway核心:实现配置和插件的主端口转发
- 掌握Java基本操作:增删查改入门代码详解
- Apache Tomcat 7.0.109 Windows版下载指南
- Qt实现文件系统浏览器界面设计与功能开发
- ReactJS新手实验:搭建与运行教程
- 探索生成艺术:几个月创意Processing实验
- Django框架下Cisco IOx平台实战开发案例源码解析
- 在Linux环境下配置Java版VTK开发环境
- 29街网上城市公司网站系统v1.0:企业建站全面解决方案
- WordPress CMB2插件的Suggest字段类型使用教程
- TCP协议实现的Java桌面聊天客户端应用
- ANR-WatchDog: 检测Android应用无响应并报告异常