python从excel获取数据并进行独热编码,最后将数据导出到csv文件
时间: 2023-05-31 13:08:04 浏览: 577
可以的,您可以使用pandas库来读取excel文件,使用sklearn库中的OneHotEncoder完成独热编码,最后使用pandas库将数据导出到csv文件中。具体操作可以参考以下代码:
```python
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
# 读取excel文件
df = pd.read_excel('data.xlsx')
# 获取需要编码的列
encode_cols = ['gender', 'age', 'job']
# 进行独热编码
enc = OneHotEncoder()
enc.fit(df[encode_cols])
encoded = enc.transform(df[encode_cols]).toarray()
encoded_cols = enc.get_feature_names(encode_cols)
# 将编码后的结果添加到原始数据中
df_encoded = pd.DataFrame(encoded, columns=encoded_cols)
df = pd.concat([df, df_encoded], axis=1)
# 导出数据到csv文件中
df.to_csv('data_encoded.csv', index=False)
```
阅读全文