数据标准化处理python
时间: 2024-02-21 17:55:07 浏览: 67
python数据预处理之数据标准化的几种处理方式
数据标准化是一种常用的数据预处理方法,用于将不同尺度和范围的数据转化为统一的标准尺度。在Python中,可以使用多种方法进行数据标准化处理,以下是两种常用的方法:
1. 最小-最大标准化(Min-Max标准化):
最小-最大标准化是将数据线性地映射到指定的最小值和最大值之间的过程。公式如下:
```
X_scaled = (X - X_min) / (X_max - X_min)
```
其中,X_scaled是标准化后的数据,X是原始数据,X_min是原始数据的最小值,X_max是原始数据的最大值。
以下是一个使用最小-最大标准化处理数据的示例代码:
```python
from sklearn.preprocessing import MinMaxScaler
data = [[1, 2, 3],
[4, 5, 6],
[7, 8, 9]]
scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(data)
print(scaled_data)
```
输出结果为:
```
[[0. 0. 0. ]
[0.5 0.5 0.5 ]
[1. 1. 1. ]]
```
2. 标准差标准化(Z-score标准化):
标准差标准化是将数据转化为均值为0,标准差为1的分布。公式如下:
```
X_scaled = (X - X_mean) / X_std
```
其中,X_scaled是标准化后的数据,X是原始数据,X_mean是原始数据的均值,X_std是原始数据的标准差。
以下是一个使用标准差标准化处理数据的示例代码:
```python
from sklearn.preprocessing import StandardScaler
data = [[1, 2, 3],
[4, 5, 6],
[7, 8, 9]]
scaler = StandardScaler()
scaled_data = scaler.fit_transform(data)
print(scaled_data)
```
输出结果为:
```
[[-1.22474487 -1.22474487 -1.22474487]
[ 0. 0. 0. ]
[ 1.22474487 1.22474487 1.22474487]]
```
阅读全文