数据的标准化和归一化
时间: 2024-05-15 11:09:30 浏览: 135
数据的标准化和归一化是在数据预处理过程中常用的两种方法,用于将不同尺度或分布的数据转换为统一的标准形式,以便更好地进行数据分析和建模。
1. 数据标准化(Standardization):
数据标准化是指将原始数据按照一定的比例缩放,使其均值为0,标准差为1。常用的标准化方法是Z-score标准化,公式如下:
z = (x - mean) / std
其中,x是原始数据,mean是数据的均值,std是数据的标准差。标准化后的数据z符合标准正态分布,均值为0,标准差为1。
2. 数据归一化(Normalization):
数据归一化是指将原始数据按照一定的比例缩放到一个特定的范围内,常见的归一化方法有最小-最大归一化和正则化。
- 最小-最大归一化(Min-Max normalization)将原始数据线性映射到[0, 1]的范围内,公式如下:
x' = (x - min) / (max - min)
其中,x是原始数据,min和max分别是数据的最小值和最大值。
- 正则化(Normalization)将每个样本缩放到单位范数(向量的长度为1),常用的正则化方法是L2正则化,公式如下:
x' = x / ||x||
其中,x是原始数据,||x||表示向量x的L2范数。
阅读全文