get_dummies 反函数
时间: 2023-09-28 20:12:24 浏览: 73
pandas使用get_dummies进行one-hot编码的方法
5星 · 资源好评率100%
get_dummies 函数是将分类变量转换为哑变量(虚拟变量)的函数,它的反函数是使用 argmax 函数将哑变量转换回分类变量。
示例代码:
```python
import pandas as pd
df = pd.DataFrame({'fruit': ['apple', 'banana', 'orange'], 'count': [2, 3, 1]})
dummies = pd.get_dummies(df['fruit'])
print(dummies)
# Output:
# apple banana orange
# 0 1 0 0
# 1 0 1 0
# 2 0 0 1
categories = dummies.idxmax(axis=1)
print(categories)
# Output:
# 0 apple
# 1 banana
# 2 orange
# dtype: object
```
在上面的示例中,我们使用 get_dummies 函数将 'fruit' 列转换为哑变量。然后,我们可以使用 idxmax 函数找到每行中值为 1 的列,并将其转换为分类变量。
阅读全文