python可视化描述类别型变量对目标变量的影响程度,其中目标变量只有0和1两类
时间: 2023-07-16 13:13:51 浏览: 147
针对这种情况,可以使用柱状图或堆叠条形图来可视化类别型变量对目标变量的影响程度。下面是一个简单的例子:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 创建示例数据
data = pd.DataFrame({
'category': ['A', 'B', 'C', 'D', 'E'],
'count_0': [25, 20, 15, 10, 30],
'count_1': [15, 10, 5, 5, 20]
})
# 计算百分比
data['percent_0'] = data['count_0'] / (data['count_0'] + data['count_1'])
data['percent_1'] = 1 - data['percent_0']
# 绘制堆叠条形图
plt.bar(data['category'], data['percent_0'], label='0')
plt.bar(data['category'], data['percent_1'], bottom=data['percent_0'], label='1')
plt.legend()
plt.show()
```
上述代码中,我们假设有五个类别型变量 A、B、C、D 和 E,每个变量对应两个计数值:count_0 和 count_1,分别表示目标变量为 0 和 1 时的样本数量。我们通过计算比例并绘制堆叠条形图来可视化类别型变量对目标变量的影响程度。其中,每个条形图表示一个类别,颜色分别表示目标变量为 0 和 1 时的样本比例。
阅读全文