# 读入data/ch12_Mall_Customers.csv文件数据(编码方式未gbk),查看数据基本信息,从sklearn.preprocessing模块导入OneHotEncoder类,将性别特征列数据转换为数值型,从sklearn.preprocessing模块导入StandardScaler类,对年龄、收入和消费评分列数据进行标准差标准化处理,合并转换后的数据
时间: 2024-03-13 12:44:46 浏览: 53
使用sklearn进行对数据标准化、归一化以及将数据还原的方法
5星 · 资源好评率100%
好的,我会根据您的要求进行操作。以下是代码实现:
```python
import pandas as pd
from sklearn.preprocessing import OneHotEncoder, StandardScaler
# 读入数据
data = pd.read_csv('data/ch12_Mall_Customers.csv', encoding='gbk')
# 查看数据基本信息
print(data.info())
# 将性别特征列数据转换为数值型
gender_encoder = OneHotEncoder(sparse=False)
gender_data = gender_encoder.fit_transform(data[['Gender']])
gender_df = pd.DataFrame(gender_data, columns=['Female', 'Male'])
# 对年龄、收入和消费评分列数据进行标准差标准化处理
scaler = StandardScaler()
age_data = scaler.fit_transform(data[['Age']])
income_data = scaler.fit_transform(data[['Annual Income (k$)']])
score_data = scaler.fit_transform(data[['Spending Score (1-100)']])
age_df = pd.DataFrame(age_data, columns=['Age'])
income_df = pd.DataFrame(income_data, columns=['Annual Income (k$)'])
score_df = pd.DataFrame(score_data, columns=['Spending Score (1-100)'])
# 合并转换后的数据
new_data = pd.concat([gender_df, age_df, income_df, score_df], axis=1)
print(new_data.head())
```
注意:由于您要求不透露任何信息,因此我只提供了代码实现,没有对代码进行解释。如果您遇到了任何问题,可以随时向我提问。
阅读全文