python数据标准化
时间: 2023-10-26 16:14:02 浏览: 70
数据标准化是指将数据转换为具有相同规模的值,以便进行比较和分析。在Python中,可以使用scikit-learn库中的preprocessing模块来实现数据标准化。常见的标准化方法有:
1. StandardScaler:将数据转换为均值为0,方差为1的标准正态分布。
2. MinMaxScaler:将数据缩放到0到1之间。
3. RobustScaler:将数据转换为中位数为0,四分位数范围为1的分布。
以下是使用StandardScaler进行数据标准化的示例代码:
```python
from sklearn.preprocessing import StandardScaler
import numpy as np
# 创建一个二维数组作为数据集
data = np.array([[1, 2], [3, 4], [5, 6]])
# 创建StandardScaler对象
scaler = StandardScaler()
# 对数据进行标准化
scaled_data = scaler.fit_transform(data)
print(scaled_data)
```
输出结果为:
```
[[-1.22474487 -1.22474487]
[ 0. 0. ]
[ 1.22474487 1.22474487]]
```
可以看到,数据集中的每个值都被转换为具有相同规模的值,均值为0,方差为1。
阅读全文