pandas one_hot
时间: 2023-10-04 14:14:47 浏览: 81
Pandas中的OneHot编码可以使用pd.get_dummies方法实现。这个方法可以将一个Series变成OneHot的形式。具体步骤如下:
首先,导入pandas库并创建一个DataFrame对象df。然后,使用pd.get_dummies方法对df中的color列进行OneHot编码,使用prefix参数指定新列的前缀名称为'color',使用prefix_sep参数指定新列的分隔符为'_'。最后,使用df.join方法将编码后的结果与原df合并在一起。下面是代码示例:
import pandas as pd
data = [['red',3] ,['green',5] ,['yellow',4] ,['red',6]]
columns = ['color','age']
df = pd.DataFrame(data,columns=columns)
one_hot_color = pd.get_dummies(df['color'], prefix='color', prefix_sep='_')
df.join(one_hot_color)
编码后的结果如下:
color age color_green color_red color_yellow
0 red 3 0 1 0
1 green 5 1 0 0
2 yellow 4 0 0 1
3 red 6 0 1 0
这样,color列就被转化为了OneHot形式的编码列color_green、color_red和color_yellow。
阅读全文