数据标准化与归一化代码
时间: 2023-09-30 19:03:34 浏览: 235
数据标准化和归一化是常用的数据预处理技术,可以将不同尺度的数据转换为统一的范围,以便于模型的训练和比较。以下是一些常见的数据标准化和归一化方法的代码示例:
1. 标准化(Standardization):将数据转换为均值为0,标准差为1的分布。
```python
from sklearn.preprocessing import StandardScaler
# 创建 StandardScaler 对象
scaler = StandardScaler()
# 使用 fit_transform 方法进行标准化
X_scaled = scaler.fit_transform(X)
```
2. 最小-最大归一化(Min-Max Normalization):将数据缩放到给定的最小值和最大值之间。
```python
from sklearn.preprocessing import MinMaxScaler
# 创建 MinMaxScaler 对象,指定归一化范围
scaler = MinMaxScaler(feature_range=(0, 1))
# 使用 fit_transform 方法进行归一化
X_scaled = scaler.fit_transform(X)
```
3. 归一化(Normalization):将数据转换为单位范数(向量的长度为1)。
```python
from sklearn.preprocessing import Normalizer
# 创建 Normalizer 对象
scaler = Normalizer()
# 使用 fit_transform 方法进行归一化
X_scaled = scaler.fit_transform(X)
```
这些代码示例使用了 scikit-learn 库中的相关功能来实现数据标准化和归一化。注意,`X` 是输入数据,可以是一个特征矩阵或样本向量。根据具体的任务和数据特点,选择适合的数据预处理方法进行标准化和归一化。
阅读全文