离散化 • 三种类型的属性值: • 名称型(Nominal)——e.g. 无序集合中的值 • 序数型(Ordinal)——e.g. 有序集合中的值 • 数值型(Numeric)——e.g. 实数 • 离散化 • 将连续属性的范围划分为区间 • 有效的规约数据 • 基于决策树的分类 • 离散化的数值用于进一步分析介绍
时间: 2024-04-01 13:38:02 浏览: 81
模拟集成电路的分析与设计:Chapter 9-Operational Amplifier.ppt
离散化
离散化是一种数据预处理技术,它将连续型的数值数据转化为离散型的数据。在数据挖掘中,离散化是一种常用的数据预处理技术,它可以将连续属性的范围划分为多个离散的区间,从而将连续型的数据转化为离散型的数据。
三种类型的属性值
在离散化之前,需要了解三种类型的属性值。其中,名称型属性值指的是无序集合中的值,例如颜色、国家等;序数型属性值指的是有序集合中的值,例如等级、分数等;数值型属性值指的是实数,例如年龄、身高等。
离散化的应用
离散化的主要应用之一是对数据进行规约。在处理大量数据时,离散化可以将连续的数值范围划分为若干个区间,从而减少数据的数量,提高数据处理的效率。除此之外,离散化还可以用于基于决策树的分类,通过将连续型的属性值转化为离散型的属性值,可以提高决策树分类的准确性。离散化的数值还可以用于进一步的数据分析,例如聚类分析、关联规则挖掘等。
阅读全文