matplotlib探索泰坦尼克灾难数据
时间: 2023-12-27 22:24:45 浏览: 76
要使用matplotlib探索泰坦尼克灾难数据,你可以按照以下步骤进行操作:
1. 导入所需的库和数据集:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据集
data = pd.read_csv('titanic.csv')
```
2. 数据预处理和探索:
```python
# 查看数据集的前几行
print(data.head())
# 统计存活和死亡人数
survived_count = data['Survived'].value_counts()
print(survived_count)
# 绘制存活和死亡人数的柱状图
plt.bar(survived_count.index, survived_count.values)
plt.xlabel('Survived')
plt.ylabel('Count')
plt.title('Survived vs Count')
plt.show()
```
3. 进一步探索数据:
```python
# 统计不同性别的存活和死亡人数
gender_survived_count = data.groupby(['Sex', 'Survived']).size().unstack()
print(gender_survived_count)
# 绘制不同性别的存活和死亡人数的堆叠柱状图
gender_survived_count.plot(kind='bar', stacked=True)
plt.xlabel('Sex')
plt.ylabel('Count')
plt.title('Survived vs Count by Gender')
plt.show()
```
4. 更多探索:
你还可以使用matplotlib绘制其他类型的图表,如饼图、散点图、箱线图等,以进一步探索泰坦尼克灾难数据。
阅读全文