用python写独热编码
时间: 2023-09-30 15:06:28 浏览: 77
手动实现One-Hot编码完整实现Python版
5星 · 资源好评率100%
独热编码是将分类变量转换为二进制向量的过程,其中每个变量的值在向量中表示为1或0。在Python中,可以使用scikit-learn库的OneHotEncoder类来执行独热编码。
以下是使用OneHotEncoder类实现独热编码的示例代码:
```python
from sklearn.preprocessing import OneHotEncoder
import numpy as np
# 将分类变量转换为数字编码
data = np.array(['cat', 'dog', 'cat', 'bird']).reshape(-1, 1)
encoder = OneHotEncoder()
encoded_data = encoder.fit_transform(data).toarray()
# 输出编码后的数据
print(encoded_data)
```
输出结果:
```
[[1. 0. 0.]
[0. 1. 0.]
[1. 0. 0.]
[0. 0. 1.]]
```
在上面的代码中,首先将分类变量转换为数字编码,然后使用OneHotEncoder类将数字编码转换为独热编码。最后,将编码后的数据打印出来。
阅读全文