jupyter哑变量设置
时间: 2023-10-21 17:26:57 浏览: 124
Student-Percentage-Prediction:这是一个线性回归任务,因为它仅涉及2个变量
要在Jupyter Notebook中设置哑变量,你可以使用pandas库的get_dummies()函数。这个函数将一列离散型数据转换成多列二进制哑变量。
下面是一个简单的示例:
```python
import pandas as pd
# 创建一个包含离散型数据的DataFrame
data = pd.DataFrame({'颜色': ['红', '蓝', '绿', '红', '绿', '蓝']})
# 使用get_dummies()函数获取哑变量
ummies = pd.get_dummies(data['颜色'])
# 将哑变量添加到原始DataFrame中
data = pd.concat([data, dummies], axis=1)
# 打印结果
print(data)
```
运行以上代码,你会得到如下输出:
```
颜色 绿 红 蓝
0 红 0 1 0
1 蓝 0 0 1
2 绿 1 0 0
3 红 0 1 0
4 绿 1 0 0
5 蓝 0 0 1
```
在这个示例中,`data` DataFrame包含了一列名为"颜色"的离散型数据。`get_dummies()`函数将"颜色"列转换成了三列二进制哑变量("绿"、"红"和"蓝")。然后,使用`concat()`函数将哑变量添加到原始DataFrame中。
阅读全文