pandas 如何将某一列转化为one-hot
时间: 2023-10-10 11:13:17 浏览: 338
pandas使用get_dummies进行one-hot编码的方法
可以使用 pandas 中的 `get_dummies()` 函数来将某一列转化为 one-hot 编码。具体步骤如下:
1. 首先选取需要转化为 one-hot 的列,假设列名为 `column_name`,并将其从原始数据中分离出来,得到一个 Series 类型的数据。
```python
column = df['column_name']
```
2. 使用 `get_dummies()` 函数将该列转化为 one-hot 编码。该函数会将该列中的每个不同的值都视为一种类别,生成多个新的列,每列代表一种类别,如果该行所属的类别是该列,则该列对应位置为 1,否则为 0。
```python
one_hot_column = pd.get_dummies(column)
```
3. 将转化后的 one-hot 编码列与原始数据合并,可以使用 `concat()` 函数或者 `join()` 函数来完成。
```python
df = pd.concat([df, one_hot_column], axis=1) # axis=1 表示按列合并
```
最终得到的 `df` 数据集中,`column_name` 列被转化为了多个新的 one-hot 编码列。
阅读全文