解决get_dummies处理中文后把他们变成了TRUE和FALSE,我需要0或者1
时间: 2024-02-09 07:11:45 浏览: 239
pandas使用get_dummies进行one-hot编码的方法
5星 · 资源好评率100%
可以使用get_dummies函数的参数`prefix`和`prefix_sep`来指定生成哑变量列名的前缀和前缀分隔符,然后使用astype函数将TRUE和FALSE转换为1和0。示例如下:
```python
import pandas as pd
# 创建包含中文的DataFrame
df = pd.DataFrame({'gender': ['男', '女', '男', '女']})
# 使用get_dummies函数生成哑变量矩阵,并指定前缀和前缀分隔符
dummy_df = pd.get_dummies(df['gender'], prefix='gender', prefix_sep='=')
# 将TRUE和FALSE转换为1和0
dummy_df = dummy_df.astype(int)
# 将哑变量矩阵合并到原始DataFrame
df = pd.concat([df, dummy_df], axis=1)
print(df)
```
输出结果为:
```
gender gender=女 gender=男
0 男 0 1
1 女 1 0
2 男 0 1
3 女 1 0
```
这样就可以将哑变量矩阵中的TRUE和FALSE转换为1和0了。
阅读全文