如何把一个数据集的某一列标签转换成one-hot编码
时间: 2023-05-16 10:07:24 浏览: 453
pytorch实现onehot编码转为普通label标签
可以使用 pandas 库中的 get_dummies() 函数将数据集的某一列标签转换成 one-hot 编码。具体实现方法如下:
```python
import pandas as pd
# 读取数据集
data = pd.read_csv('data.csv')
# 将某一列标签转换成 one-hot 编码
one_hot = pd.get_dummies(data['label'])
# 将 one-hot 编码添加到数据集中
data = pd.concat([data, one_hot], axis=1)
# 删除原来的标签列
data.drop('label', axis=1, inplace=True)
# 输出转换后的数据集
print(data.head())
```
其中,get_dummies() 函数会将标签列中的每个不同取值都转换成一个新的列,列名为该取值,列中的值为 0 或 1,表示该样本是否属于该取值。最后将转换后的列添加到原数据集中,并删除原来的标签列。
阅读全文