get_dummies
时间: 2024-05-13 07:18:32 浏览: 8
`get_dummies`是Pandas库中的一个函数,用于将一个包含分类变量的数据集转换成虚拟变量矩阵。也就是说,它将一个具有类别属性的列转化为多个二元属性的列。例如,如果有一个名为color的列,其中包含红、绿和蓝三种颜色,将使用`get_dummies`函数将其转换为三个新的列,分别为color_red、color_green和color_blue,每个新列包含0或1的值,表示是否为相应的颜色。
下面是一个简单的例子,假设有一个包含颜色和尺寸两个属性的数据集:
```
import pandas as pd
data = pd.DataFrame({'color': ['red', 'green', 'blue', 'red', 'green', 'red'],
'size': ['small', 'medium', 'large', 'large', 'small', 'medium']})
```
使用`get_dummies`函数将`color`和`size`两个属性转换为虚拟变量矩阵:
```
dummies = pd.get_dummies(data, columns=['color', 'size'])
print(dummies)
```
输出结果如下:
```
color_blue color_green color_red size_large size_medium size_small
0 0 0 1 0 0 1
1 0 1 0 0 1 0
2 1 0 0 1 0 0
3 0 0 1 1 0 0
4 0 1 0 0 0 1
5 0 0 1 0 1 0
```
可以看到,`get_dummies`函数将颜色和尺寸两个属性转换为了虚拟变量矩阵,每个属性的每个取值都被转换为了一个新的列。