首页python从excel获取数据并进行独热编码，最后将数据导出到csv文件

python从excel获取数据并进行独热编码，最后将数据导出到csv文件

时间: 2023-05-31 13:08:04 浏览: 577

可以的，您可以使用pandas库来读取excel文件，使用sklearn库中的OneHotEncoder完成独热编码，最后使用pandas库将数据导出到csv文件中。具体操作可以参考以下代码： ```python import pandas as pd from sklearn.preprocessing import OneHotEncoder # 读取excel文件 df = pd.read_excel('data.xlsx') # 获取需要编码的列 encode_cols = ['gender', 'age', 'job'] # 进行独热编码 enc = OneHotEncoder() enc.fit(df[encode_cols]) encoded = enc.transform(df[encode_cols]).toarray() encoded_cols = enc.get_feature_names(encode_cols) # 将编码后的结果添加到原始数据中 df_encoded = pd.DataFrame(encoded, columns=encoded_cols) df = pd.concat([df, df_encoded], axis=1) # 导出数据到csv文件中 df.to_csv('data_encoded.csv', index=False) ```

阅读全文