python独热编码代码实现
时间: 2023-07-25 21:25:39 浏览: 88
手动实现One-Hot编码完整实现Python版
5星 · 资源好评率100%
可以使用 scikit-learn 库中的 OneHotEncoder 来实现 Python 独热编码:
```python
from sklearn.preprocessing import OneHotEncoder
import numpy as np
# 创建一个样本数据
data = np.array([[1], [2], [3], [2]])
# 创建 OneHotEncoder 对象
enc = OneHotEncoder()
# 对数据进行独热编码
enc.fit(data)
result = enc.transform(data).toarray()
print(result)
```
输出结果:
```
[[1. 0. 0.]
[0. 1. 0.]
[0. 0. 1.]
[0. 1. 0.]]
```
其中,data 是一个包含多个样本的数组,每个样本只有一个特征。OneHotEncoder 对象会对每个特征进行独热编码,最终返回一个二维数组。在这个例子中,原始数据只有一个特征,所以编码后返回的数组是一个 n * k 的矩阵,其中 n 是样本数,k 是特征取值的数量。
阅读全文