首页join(pd.get_dummies(features1[cate])).drop(cate,axis=1)

join(pd.get_dummies(features1[cate])).drop(cate,axis=1)

时间: 2023-05-22 18:06:50 浏览: 151

pandas使用get_dummies进行one-hot编码的方法

离散特征的编码分为两种情况： 1、离散特征的取值之间没有大小的意义，比如color：[red,blue],那么就使用one-hot编码 2、离散特征的取值有大小的意义，比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3} 使用pandas可以很方便的对离散型特征进行one-hot编码 import pandas as pd df = pd.DataFrame([ ['green', 'M', 10.1, 'class1'], ['red', 'L', 13.5, 'class2'], ['blue', 'XL', 15.3, 'class

这是一个使用 pandas 中的 get_dummies 函数进行 one-hot 编码的操作，其中 features1 是要进行编码的数据集，cate 是要进行编码的特征列。该操作将特征列进行 one-hot 编码，并将原特征列删除，返回已编码的数据集。

阅读全文