通过Min-Max归一化将两列不同类的数据规范化到区间的例子
时间: 2024-04-01 22:36:49 浏览: 167
假设有一个包含两列不同类的数据集,第一列为身高(单位为cm),第二列为年龄(单位为岁)。现在我们想要将这两列数据规范化到区间[0,1]之间,可以按照以下步骤进行:
1. 找到每列数据中的最小值和最大值,分别为:身高的最小值160cm,最大值180cm;年龄的最小值20岁,最大值40岁。
2. 对于每列数据中的每个数据值x,通过以下公式将其规范化到[0,1]之间:
x' = (x - min) / (max - min)
对于身高这一列的数据值,可以按照以下步骤进行规范化:
- 对于160cm的身高,x' = (160 - 160) / (180 - 160) = 0
- 对于170cm的身高,x' = (170 - 160) / (180 - 160) = 0.5
- 对于180cm的身高,x' = (180 - 160) / (180 - 160) = 1
因此,规范化后的身高数据为:0、0.5、1。
对于年龄这一列的数据值,可以按照以下步骤进行规范化:
- 对于20岁的年龄,x' = (20 - 20) / (40 - 20) = 0
- 对于30岁的年龄,x' = (30 - 20) / (40 - 20) = 0.5
- 对于40岁的年龄,x' = (40 - 20) / (40 - 20) = 1
因此,规范化后的年龄数据为:0、0.5、1。
3. 对于新的身高和年龄数据值,也可以使用同样的方法进行规范化,例如,如果有一个新的身高为175cm,年龄为25岁的人,可以按照以下步骤进行规范化:
对于身高:x' = (175 - 160) / (180 - 160) = 0.75
对于年龄:x' = (25 - 20) / (40 - 20) = 0.25
因此,规范化后的身高和年龄分别为0.75和0.25。
阅读全文