MinMaxScaler归一化反归一化
时间: 2024-12-26 09:18:32 浏览: 4
### 使用 `MinMaxScaler` 进行数据归一化和反归一化
#### 数据归一化过程
为了执行数据的归一化,可以利用 `sklearn.preprocessing.MinMaxScaler` 类。此工具能够将特征按列线性变换到指定范围内,默认情况下是 `[0, 1]`。
下面是一个具体的例子来展示如何应用 `MinMaxScaler` 对数据集进行归一化:
```python
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
def minmax_normalization():
''' 归一化并保存转换器用于后续反向转换 '''
# 加载数据
data = pd.read_csv('./database/dating.txt', sep='\t')
print("原始数据:\n", data)
# 创建 MinMaxScaler 的实例对象
scaler = MinMaxScaler(feature_range=(0, 1))
# 应用 fit_transform 方法对选定的数据列做归一化处理
scaled_data = scaler.fit_transform(data[['milage','Liters','Consumtime']])
print('Min-Max归一化后的结果:\n', scaled_data)
return scaler, scaled_data
scaler, normalized_data = minmax_normalization()
```
#### 数据反归一化过程
当需要恢复经过归一化的数值回原来的尺度时,则可以通过调用已经训练好的 `MinMaxScaler` 实例上的 `.inverse_transform()` 函数实现这一目标。这允许用户获取原本未被缩放过的实际值。
下面是关于怎样完成这个逆操作的例子:
```python
def reverse_minmax(scaler, transformed_data):
''' 将已归一化的数据还原成原样 '''
# 利用之前存储下来的 scaler 来反转归一化
original_data = scaler.inverse_transform(transformed_data)
print('反归一化后的结果:\n', original_data)
reverse_minmax(scaler, normalized_data)
```
通过上述两部分代码,可以看到完整的流程是从加载数据开始,接着创建一个 `MinMaxScaler` 并对其进行拟合以及转换;最后再基于同一个 `MinMaxScaler` 完成了从归一化状态返回至初始状态的操作[^1]。
阅读全文