python 中心标准化
时间: 2023-05-29 21:02:11 浏览: 103
中心标准化是一种常见的数据预处理技术,用于将数据的均值设为0,标准差设为1。这样做有以下几个好处:
1. 可以消除不同特征之间的量纲或单位不同的影响,使得不同特征具有可比性。
2. 可以避免特征值过大或过小对模型造成影响,提高模型的收敛速度和准确度。
在 Python 中,可以使用 scikit-learn 中的 StandardScaler 类来进行中心标准化。具体实现方法如下:
```python
from sklearn.preprocessing import StandardScaler
# 构造数据
X = [[1, 2], [4, 8], [3, 6], [2, 4]]
# 创建 StandardScaler 对象
scaler = StandardScaler()
# 对数据进行中心标准化
scaled_X = scaler.fit_transform(X)
print(scaled_X)
```
输出结果为:
```
[[-1.34164079 -1.34164079]
[ 1.33630621 1.33630621]
[ 0.26726124 0.26726124]
[-0.26192667 -0.26192667]]
```
可以看到,经过中心标准化之后,数据的均值为0,标准差为1。
阅读全文