数据挖掘入门:概念、技术与实践
需积分: 50 142 浏览量
更新于2024-10-10
收藏 1.83MB PDF 举报
"数据挖掘-概念与技术"
本书《数据挖掘:概念与技术》是数据挖掘领域的入门经典,适合初学者了解这一领域。作者韩家炜和J.Han、M.Kamber共同探讨了数据挖掘的基本概念和技术,阐述了数据挖掘的重要性和应用背景。
在第一章中,作者介绍了数据挖掘的激发因素及其重要性,指出数据挖掘是在关系数据库、数据仓库、事务数据库等不同类型的数据集上进行的。数据挖掘的主要功能包括:概念/类描述、关联分析、分类与预测、聚类分析、局外者分析和演变分析。他们讨论了并非所有模式都是有趣或有用的,并对数据挖掘系统的分类进行了概述,同时列出了数据挖掘过程中面临的主要问题。
第二章深入讨论了数据仓库和OLAP(在线分析处理)技术。数据仓库是一个用于分析而非操作的、集成的、非易失的、随时间变化的数据集合。与操作数据库系统相比,数据仓库有其独特之处,如数据仓库的多维数据模型,包括星形、雪花和事实星座模式。OLAP技术在多维数据模型上执行复杂的分析操作,如切片、 dice、钻取和roll-up。书中还介绍了数据仓库的系统结构,包括三层架构,以及ROLAP、MOLAP、HOLAP的不同之处,以及数据仓库的实现技术和未来发展。
第三章聚焦数据预处理,这是数据挖掘流程中的关键步骤。数据预处理包括数据清洗、数据转换和数据规约,以消除噪声、不一致性,以及准备数据以供分析使用。这一过程对于确保挖掘结果的质量至关重要。
通过以上内容,读者将能够理解数据挖掘的基础,掌握数据仓库和OLAP的基本原理,以及数据预处理的重要性。这本书为进入数据挖掘世界提供了坚实的基础,并引导读者逐步探索这个充满挑战和机遇的领域。
2018-12-15 上传
2019-06-28 上传
2018-06-12 上传
2010-03-19 上传
2021-11-28 上传
101 浏览量
2018-06-12 上传
2015-06-11 上传
2008-09-09 上传
heyan0616
- 粉丝: 0
- 资源: 4
最新资源
- 火炬连体网络在MNIST的2D嵌入实现示例
- Angular插件增强Application Insights JavaScript SDK功能
- 实时三维重建:InfiniTAM的ros驱动应用
- Spring与Mybatis整合的配置与实践
- Vozy前端技术测试深入体验与模板参考
- React应用实现语音转文字功能介绍
- PHPMailer-6.6.4: PHP邮件收发类库的详细介绍
- Felineboard:为猫主人设计的交互式仪表板
- PGRFileManager:功能强大的开源Ajax文件管理器
- Pytest-Html定制测试报告与源代码封装教程
- Angular开发与部署指南:从创建到测试
- BASIC-BINARY-IPC系统:进程间通信的非阻塞接口
- LTK3D: Common Lisp中的基础3D图形实现
- Timer-Counter-Lister:官方源代码及更新发布
- Galaxia REST API:面向地球问题的解决方案
- Node.js模块:随机动物实例教程与源码解析