绘制不同年龄段、性别与客舱等级的堆叠柱状图
时间: 2023-08-10 14:03:24 浏览: 115
好的,根据泰坦尼克号数据中的年龄段、性别与客舱等级,可以进行多维度的可视化分析。以下是一个简单的 Python 可视化代码示例,用于绘制不同年龄段、性别与客舱等级的堆叠柱状图:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
df = pd.read_csv('train.csv')
# 数据清洗
df = df.dropna(subset=['Age']) # 删除年龄为空的行
df['AgeGroup'] = pd.cut(df['Age'], bins=[0, 18, 30, 50, 100], labels=['<18', '18-30', '30-50', '50+']) # 分组年龄段
# 计算平均票价
fare_by_group = df.groupby(['Sex', 'Pclass', 'AgeGroup'])['Fare'].mean().unstack()
# 绘制堆叠柱状图
fare_by_group.plot(kind='bar', stacked=True)
plt.title('Fare by Age Group, Sex and Class')
plt.xlabel('Age Group, Sex and Class')
plt.ylabel('Fare')
plt.show()
```
这段代码将读取名为 `train.csv` 的泰坦尼克号数据集,并进行数据清洗和分组。然后,通过 `groupby` 函数,将数据按照不同年龄段、性别与客舱等级进行分组,并计算平均票价。最后,将结果绘制为堆叠柱状图。通过调整 `bins` 参数和 `labels` 参数,可以控制年龄段的分组情况。通过修改和调整代码,可以进行更多维度的可视化分析。
阅读全文