pd.get_dummies
时间: 2023-07-09 15:31:39 浏览: 114
pandas使用get_dummies进行one-hot编码的方法
5星 · 资源好评率100%
`pd.get_dummies` 是 pandas 库中的一个函数,用于将一个包含分类变量的 DataFrame 或 Series 转换为哑变量矩阵。哑变量矩阵是一种二进制矩阵,用于表示分类变量的取值情况。
例如,假设有一个包含性别和年龄的 DataFrame:
```
import pandas as pd
df = pd.DataFrame({
'gender': ['male', 'female', 'male', 'male', 'female'],
'age': [25, 30, 20, 35, 28]
})
```
可以使用 `pd.get_dummies` 将 `gender` 列转换为哑变量矩阵:
```
pd.get_dummies(df['gender'])
```
输出结果为:
```
female male
0 0 1
1 1 0
2 0 1
3 0 1
4 1 0
```
可以看到,`pd.get_dummies` 将 `gender` 列中的每个取值转换为了一个新的列,并用 0/1 表示该行是否属于该取值。这样做的好处是可以将分类变量用于机器学习算法中,因为大多数算法只能处理数值型数据。
阅读全文