8. matplotlib探索泰坦尼克灾难数据 (1) 将数据框命名为titanic (2) 将PassengerId设置为索引 (3) 绘制一个展示男女乘客比例的扇形图 (4) 绘制一个展示船票Fare, 与乘客年龄和性别的散点图 (5) 有多少人生还? (6) 绘制一个展示船票价格的直方图
时间: 2024-03-16 10:44:50 浏览: 67
利用Python+matplotlib对泰坦尼克号进行数据分析
好的,让我为您解答这些问题,以下是相应的Python代码:
```python
# 导入必要的库和数据集
import pandas as pd
import matplotlib.pyplot as plt
titanic = pd.read_csv('titanic.csv')
# 将PassengerId设置为索引
titanic.set_index('PassengerId', inplace=True)
# 绘制一个展示男女乘客比例的扇形图
plt.pie(titanic['Sex'].value_counts(), labels=['Male', 'Female'], autopct='%1.1f%%')
plt.title('Male/Female Proportion')
plt.show()
# 绘制一个展示船票Fare, 与乘客年龄和性别的散点图
plt.scatter(titanic['Age'], titanic['Fare'], c=titanic['Sex'].map({'male': 'blue', 'female': 'red'}))
plt.xlabel('Age')
plt.ylabel('Fare')
plt.title('Fare by Age and Sex')
plt.show()
# 有多少人生还?
survivors = titanic['Survived'].sum()
print('There were {} survivors.'.format(survivors))
# 绘制一个展示船票价格的直方图
plt.hist(titanic['Fare'], bins=20)
plt.xlabel('Fare')
plt.ylabel('Frequency')
plt.title('Fare Distribution')
plt.show()
```
希望这能帮到您!
阅读全文