Python的pandas库给出示例,实现对训练数据标准化处理,并给需要预测的数据做同样的标准化处理
时间: 2024-05-19 11:16:55 浏览: 100
用pandas实现标准化.ipynb
当对训练数据实施标准化(例如,均值为 0,标准差为 1)时,应该记住:
1.使用 fit() 函数基于训练数据拟合标准化变换对象。
2.使用 transform() 函数基于拟合对象将训练数据进行标准化。
3.将同样的拟合对象应用于测试数据以便进行标准化。
下面是一个示例代码:
import pandas as pd
from sklearn.preprocessing import StandardScaler
# 读入训练数据和需要预测的数据
train_data = pd.read_csv("train.csv")
test_data = pd.read_csv("test.csv")
# 准备训练特征和标签
train_X = train_data.drop('label', axis=1)
train_y = train_data['label']
# 使用 StandardScaler 对训练数据进行标准化
scaler = StandardScaler().fit(train_X)
train_X = scaler.transform(train_X)
# 对需要预测的数据做同样的标准化处理
test_X = scaler.transform(test_data)
# 只取前 5 行展示
print(train_X[:5])
阅读全文