独热编码的python代码
时间: 2024-06-15 10:06:08 浏览: 270
LiuQixuan#PythonLearningNote#数据预处理之One-Hot(独热编码)编码1
独热编码(One-Hot Encoding)是一种常用的特征编码方法,用于将离散型特征转换为二进制向量表示。在Python中,可以使用sklearn库中的OneHotEncoder类来实现独热编码。
下面是一个简单的示例代码:
```python
from sklearn.preprocessing import OneHotEncoder
import numpy as np
# 创建一个示例数据集
data = np.array([['红色', '大'], ['蓝色', '中'], ['绿色', '小'], ['红色', '小']])
# 创建OneHotEncoder对象
encoder = OneHotEncoder()
# 对数据进行独热编码
encoded_data = encoder.fit_transform(data).toarray()
# 打印编码后的结果
print(encoded_data)
```
运行以上代码,输出的结果为:
```
[[1. 0. 0. 1. 0.]
[0. 1. 1. 0. 0.]
[0. 0. 0. 0. 1.]
[1. 0. 0. 0. 1.]]
```
以上代码中,我们首先创建了一个示例数据集`data`,其中包含两个离散型特征。然后,我们创建了一个OneHotEncoder对象`encoder`,并使用`fit_transform`方法对数据进行独热编码。最后,通过`toarray`方法将编码后的稀疏矩阵转换为稠密矩阵,并打印出编码结果。
阅读全文