多分类分成四类的独热编码用python代码怎么写
时间: 2023-12-17 07:50:42 浏览: 88
基于Python实现多类别文本分类.zip
5星 · 资源好评率100%
独热编码(One-Hot Encoding)是将离散型特征的取值扩展到一个新的维度,将其转换为0和1的形式,适用于分类问题。
在Python中,可以使用sklearn库中的LabelBinarizer类实现独热编码。下面是一个将四类进行独热编码的示例代码:
```python
from sklearn.preprocessing import LabelBinarizer
# 假设有4个类别,分别为a、b、c、d
classes = ['a', 'b', 'c', 'd']
# 创建LabelBinarizer对象
lb = LabelBinarizer()
# 对类别进行独热编码
encoded_classes = lb.fit_transform(classes)
print(encoded_classes)
```
输出结果为:
```
array([[1, 0, 0, 0],
[0, 1, 0, 0],
[0, 0, 1, 0],
[0, 0, 0, 1]])
```
其中,每一行表示一个类别的编码,对应的位置为1,其余位置为0。例如,第一行表示类别a被编码为[1,0,0,0]。
阅读全文