"数据挖掘导论第2章:数据类型、质量与预处理"
数据挖掘导论第二版第2章:数据介绍了数据分析的概要内容。数据分析涉及属性和对象,数据类型,数据质量,相似与距离以及数据预处理等方面。数据是指数据对象及其属性的集合,属性是对数据对象特征的体现,也称为变量、字段、特征、维度或特征。数据对象用一组刻画对象基本特性的属性描述。数据对象也可以被称为记录、点、向量、模式、事件、案例、样本、观测或实体。通过对数据的属性进行分析,可以更好地了解数据的特点和规律。 数据挖掘导论第二版第2章还给出了一个数据对象的示例,其中包含了属性和对象。这个示例通过属性包括退款、婚姻状况、应纳税收入和是否欺诈等来描述数据对象的基本特性。通过对这些属性的分析,可以更好地理解数据对象的特征,从而进行更深入的数据分析和数据挖掘工作。 数据分析是数据挖掘过程中的关键步骤,可以帮助用户更好地理解数据,从而为后续的数据挖掘工作奠定基础。对数据进行分析可以帮助用户发现数据之间的关系,挖掘数据背后的规律,以及发现潜在的商业价值。数据分析也可以帮助用户发现数据中的异常和错误,为数据清洗和预处理提供支持。 在数据挖掘过程中,数据的质量是至关重要的。数据质量直接影响着数据挖掘模型的建立和挖掘结果的准确性。因此,在数据分析的过程中,需要对数据进行质量评估和质量控制。只有数据质量得到保证,数据挖掘工作才能够顺利进行。 另外,数据分析还涉及数据的相似与距离的计算。相似度和距离度量是数据挖掘中的一个重要概念,可以帮助用户发现数据之间的相似性,并通过相似性进行聚类分析和分类预测。数据预处理也是数据分析过程中必不可少的一步,包括数据清洗、缺失值填补、异常值处理等,为后续的数据挖掘建模做好准备。 总的来说,数据分析是数据挖掘工作中的重要一环,通过对数据属性和对象的分析,可以更好地理解数据的特征和规律。数据分析可以帮助用户发现数据中的潜在信息和规律,为后续的数据挖掘工作提供基础和支持。因此,在数据挖掘工作中,数据分析是不可或缺的一步。
![](https://csdnimg.cn/release/download_crawler_static/26283631/bgb.jpg)
![](https://csdnimg.cn/release/download_crawler_static/26283631/bgc.jpg)
![](https://csdnimg.cn/release/download_crawler_static/26283631/bgd.jpg)
剩余63页未读,继续阅读
![pptx](https://img-home.csdnimg.cn/images/20210720083543.png)
![pptx](https://img-home.csdnimg.cn/images/20210720083543.png)
![pptx](https://img-home.csdnimg.cn/images/20210720083543.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
- 粉丝: 3
- 资源: 15
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 电力电子系统建模与控制入门
- SQL数据库基础入门:发展历程与关键概念
- DC/DC变换器动态建模与控制方法解析
- 市***专有云IaaS服务:云主机与数据库解决方案
- 紫鸟数据魔方:跨境电商选品神器,助力爆款打造
- 电力电子技术:DC-DC变换器动态模型与控制
- 视觉与实用并重:跨境电商产品开发的六重价值策略
- VB.NET三层架构下的数据库应用程序开发
- 跨境电商产品开发:关键词策略与用户痛点挖掘
- VC-MFC数据库编程技巧与实现
- 亚马逊新品开发策略:选品与市场研究
- 数据库基础知识:从数据到Visual FoxPro应用
- 计算机专业实习经验与项目总结
- Sparkle家族轻量级加密与哈希:提升IoT设备数据安全性
- SQL数据库期末考试精选题与答案解析
- H3C规模数据融合:技术探讨与应用案例解析
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)