用python写一个泰坦尼克号数据分析代码
时间: 2024-05-01 09:21:42 浏览: 185
利用Python+matplotlib对泰坦尼克号进行数据分析
好的,以下是一个简单的泰坦尼克号数据分析代码,使用了Python中的pandas和matplotlib库:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv('titanic.csv')
# 查看数据信息
print(data.info())
# 查看数据统计信息
print(data.describe())
# 绘制生存与否的条形图
survival_counts = data['Survived'].value_counts()
plt.bar(survival_counts.index, survival_counts.values)
plt.xticks([0, 1], ['Did not survive', 'Survived'])
plt.ylabel('Number of passengers')
plt.title('Survival counts')
plt.show()
# 绘制男女生存比例的饼图
sex_survival_counts = data.groupby(['Sex', 'Survived'])['Survived'].count()
sex_survival_counts.plot(kind='pie', autopct='%1.1f%%')
plt.title('Sex survival rates')
plt.show()
# 绘制不同等级船舱的生存比例的柱状图
pclass_survival_counts = data.groupby(['Pclass', 'Survived'])['Survived'].count()
pclass_survival_counts.unstack().plot(kind='bar', stacked=True)
plt.xticks(rotation=0)
plt.xlabel('Pclass')
plt.ylabel('Number of passengers')
plt.title('Pclass survival rates')
plt.show()
```
该代码首先使用`pd.read_csv()`函数读取泰坦尼克号数据,然后使用`data.info()`和`data.describe()`分别查看数据的信息和统计信息。接着,使用`plt.bar()`函数绘制了生存与否的条形图,使用`data.groupby()`函数和`plot()`方法绘制了男女生存比例的饼图和不同等级船舱的生存比例的柱状图。最后,使用`plt.show()`函数显示图形。
阅读全文