数据归一化,标准化的方法
时间: 2024-03-28 20:34:46 浏览: 129
数据标准化 归一化方法总结
5星 · 资源好评率100%
数据归一化和标准化是常用的数据预处理方法,用于将不同尺度或分布的数据转换为统一的范围或分布。下面是两种常见的方法:
1. 数据归一化(Min-Max Scaling):
数据归一化是将数据线性映射到指定的范围,通常是[0, 1]或[-1, 1]。具体步骤如下:
- 找到数据集中的最小值(min)和最大值(max)。
- 对于每个数据点,使用以下公式进行归一化处理:
归一化后的值 = (原始值 - min) / (max - min)
这种方法适用于数据分布没有明显边界的情况。
2. 数据标准化(Standardization):
数据标准化通过减去均值并除以标准差,将数据转换为均值为0,标准差为1的分布。具体步骤如下:
- 计算数据集的均值(mean)和标准差(std)。
- 对于每个数据点,使用以下公式进行标准化处理:
标准化后的值 = (原始值 - mean) / std
这种方法适用于数据分布有明显边界且存在离群值的情况。
阅读全文