首页OneHotEncoder参数

OneHotEncoder参数

时间: 2023-07-31 20:13:26 浏览: 151

one-hot编码

自己写一个小例子，方便大家清楚ont-hot编码。如果有问题，还希望大家多多指教，如果有问题，可以及时和我联系

OneHotEncoder是用于将离散特征转换为独热编码的工具，它有以下参数： - categories：指定每个特征的取值范围，可以是'auto'、'infer'、list或者array-like，默认是'auto'，表示自动推断每个特征的取值范围。 - sparse：指定是否返回稀疏矩阵，True表示返回稀疏矩阵，False表示返回密集矩阵，默认是True。 - dtype：指定输出矩阵的数据类型，默认是numpy.float64。例如，如果要将一个二维数组X的第1列特征转换为独热编码，可以使用以下代码： ```python from sklearn.preprocessing import OneHotEncoder enc = OneHotEncoder(categories='auto', sparse=False) X = [[1, 'A'], [2, 'B'], [3, 'C'], [1, 'B']] enc.fit_transform(X[:, [1]]) ``` 其中，categories='auto'表示自动推断特征取值范围，sparse=False表示返回密集矩阵。

阅读全文