绘制不同年龄段、性别与客舱等级的绘制不同年龄段、性别与客舱等级
时间: 2023-07-10 08:42:37 浏览: 113
基于MATLAB的根轨迹绘制与性能分析
好的,根据泰坦尼克号数据中的年龄段、性别与客舱等级,可以进行多维度的可视化分析。以下是一个简单的 Python 可视化代码示例,用于绘制不同年龄段、性别与客舱等级的票价散点图:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
df = pd.read_csv('train.csv')
# 数据清洗
df = df.dropna(subset=['Age']) # 删除年龄为空的行
df['AgeGroup'] = pd.cut(df['Age'], bins=[0, 18, 30, 50, 100], labels=['<18', '18-30', '30-50', '50+']) # 分组年龄段
# 绘制散点图
fig, ax = plt.subplots()
colors = {'male': 'blue', 'female': 'red'}
for key, group in df.groupby(['Sex', 'Pclass', 'AgeGroup']):
group.plot(ax=ax, kind='scatter', x='Age', y='Fare', label=key, color=colors[key[0]])
plt.title('Fare by Age Group, Sex and Class')
plt.xlabel('Age')
plt.ylabel('Fare')
plt.show()
```
这段代码将读取名为 `train.csv` 的泰坦尼克号数据集,并进行数据清洗和分组。然后,通过 `groupby` 函数,将数据按照不同年龄段、性别与客舱等级进行分组,并将结果绘制为散点图。通过调整 `bins` 参数和 `labels` 参数,可以控制年龄段的分组情况。通过修改和调整代码,可以进行更多维度的可视化分析。
阅读全文