OneHotEncoder参数
时间: 2023-07-31 20:13:26 浏览: 151
one-hot编码
OneHotEncoder是用于将离散特征转换为独热编码的工具,它有以下参数:
- categories:指定每个特征的取值范围,可以是'auto'、'infer'、list或者array-like,默认是'auto',表示自动推断每个特征的取值范围。
- sparse:指定是否返回稀疏矩阵,True表示返回稀疏矩阵,False表示返回密集矩阵,默认是True。
- dtype:指定输出矩阵的数据类型,默认是numpy.float64。
例如,如果要将一个二维数组X的第1列特征转换为独热编码,可以使用以下代码:
```python
from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder(categories='auto', sparse=False)
X = [[1, 'A'], [2, 'B'], [3, 'C'], [1, 'B']]
enc.fit_transform(X[:, [1]])
```
其中,categories='auto'表示自动推断特征取值范围,sparse=False表示返回密集矩阵。
阅读全文