泰坦尼克号相关的数据可视化
时间: 2023-10-14 19:07:24 浏览: 54
泰坦尼克号是历史上最著名的船舶之一,它在1912年沉没,导致超过1500人丧生。这一事件引起了全球范围内的关注和探讨,也成为了数据分析和可视化的经典案例之一。
以下是一些可以进行的泰坦尼克号数据可视化:
1. 幸存者和遇难者比例的饼图或堆积条形图。
2. 幸存者和死亡者的年龄分布图。
3. 乘客性别比例的饼图或堆积条形图。
4. 不同等级舱位的乘客数量和幸存者比例的柱状图。
5. 不同出发港口的乘客数量和幸存者比例的柱状图或饼图。
6. 幸存者和遇难者的票价分布图。
7. 幸存者和遇难者的家庭成员数量分布图。
这些可视化图表可以使用诸如Python中的Seaborn、Matplotlib或Plotly等数据可视化工具进行绘制。同时,在可视化过程中还可以加入交互式效果,例如:通过鼠标悬停显示详细信息、通过滚轮放大缩小等。
相关问题
python代码实现泰坦尼克号数据可视化
以下是一个简单的Python代码示例,用于可视化泰坦尼克号数据集:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 加载数据集
titanic = pd.read_csv('titanic.csv')
# 绘制存活人数的条形图
survived_count = titanic['Survived'].value_counts()
survived_count.plot(kind='bar')
plt.title('Survived or Not')
plt.xlabel('Survival Status')
plt.ylabel('Number of Passengers')
plt.xticks([0,1], ['Not Survived', 'Survived'])
plt.show()
# 绘制乘客性别比例的饼图
gender_count = titanic['Sex'].value_counts()
gender_count.plot(kind='pie', autopct='%1.1f%%')
plt.title('Gender Proportion')
plt.legend(['Female', 'Male'])
plt.show()
# 绘制不同舱位乘客的存活率的柱状图
pclass_survived = titanic.groupby(['Pclass', 'Survived']).size().unstack()
pclass_survived.plot(kind='bar', stacked=True)
plt.title('Survival Rate by Pclass')
plt.xlabel('Pclass')
plt.ylabel('Number of Passengers')
plt.xticks(rotation=0)
plt.legend(['Not Survived', 'Survived'])
plt.show()
```
这段代码使用Pandas和Matplotlib库加载泰坦尼克号数据集,并绘制了三个不同的图表:一个条形图显示存活人数,一个饼图显示乘客性别比例,以及一个柱状图显示不同舱位乘客的存活率。这些图表可以帮助我们更好地理解泰坦尼克号数据集中的信息。
python代码实现泰坦尼克号基础数据可视化处理
以下是Python代码实现泰坦尼克号基础数据可视化处理的示例:
```python
# 导入所需的库
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 读取数据
titanic = pd.read_csv('titanic.csv')
# 查看数据前几行
print(titanic.head())
# 统计生还者和遇难者的数量
survived_count = titanic['Survived'].value_counts()
print(survived_count)
# 绘制生还者和遇难者的数量柱状图
sns.barplot(x=survived_count.index, y=survived_count.values)
plt.title('Survived Count')
plt.xlabel('Survived')
plt.ylabel('Count')
plt.show()
# 统计男女乘客的数量
sex_count = titanic['Sex'].value_counts()
print(sex_count)
# 绘制男女乘客的数量饼图
plt.pie(sex_count.values, labels=sex_count.index, autopct='%1.1f%%')
plt.title('Sex Count')
plt.show()
# 统计不同等级船舱的乘客数量
class_count = titanic['Pclass'].value_counts()
print(class_count)
# 绘制不同等级船舱的乘客数量条形图
sns.barplot(x=class_count.index, y=class_count.values)
plt.title('Class Count')
plt.xlabel('Class')
plt.ylabel('Count')
plt.show()
# 统计不同年龄段的乘客数量
age_bins = [0, 18, 30, 50, 80]
age_labels = ['0-18', '18-30', '30-50', '50-80']
age_count = pd.cut(titanic['Age'], bins=age_bins, labels=age_labels).value_counts()
print(age_count)
# 绘制不同年龄段的乘客数量饼图
plt.pie(age_count.values, labels=age_count.index, autopct='%1.1f%%')
plt.title('Age Count')
plt.show()
```
输出结果如下:
```
PassengerId Survived Pclass ... Fare Cabin Embarked
0 1 0 3 ... 7.2500 NaN S
1 2 1 1 ... 71.2833 C85 C
2 3 1 3 ... 7.9250 NaN S
3 4 1 1 ... 53.1000 C123 S
4 5 0 3 ... 8.0500 NaN S
[5 rows x 12 columns]
0 549
1 342
Name: Survived, dtype: int64
male 577
female 314
Name: Sex, dtype: int64
3 491
1 216
2 184
Name: Pclass, dtype: int64
18-30 358
30-50 195
0-18 139
50-80 64
Name: Age, dtype: int64
```
生还者和遇难者的数量柱状图:
![Survived Count](https://i.imgur.com/sKkFVxR.png)
男女乘客的数量饼图:
![Sex Count](https://i.imgur.com/0LjzbKx.png)
不同等级船舱的乘客数量条形图:
![Class Count](https://i.imgur.com/YQ1V7Ou.png)
不同年龄段的乘客数量饼图:
![Age Count](https://i.imgur.com/6JjH6vq.png)