泰坦尼克号相关的数据可视化
时间: 2023-10-14 07:07:20 浏览: 46
泰坦尼克号是一艘著名的邮轮,在其首航中沉没,造成了大量的伤亡。以下是一些关于泰坦尼克号的数据可视化:
1. 幸存者与死亡者人数比例饼图
可以用饼图展示泰坦尼克号上幸存者和死亡者的比例。可以用不同的颜色表示幸存者和死亡者,展示出比例关系。
2. 幸存者与死亡者的性别比例饼图
可以用饼图展示泰坦尼克号上幸存者和死亡者的性别比例。可以用不同的颜色表示男性和女性幸存者和死亡者,展示出比例关系。
3. 年龄分布直方图
可以用直方图展示泰坦尼克号上乘客的年龄分布。将年龄范围划分为不同的组,并用不同颜色的条形图表示每个年龄组的乘客数量。
4. 舱位等级与幸存者比例堆叠条形图
可以用堆叠条形图展示泰坦尼克号上舱位等级和幸存者的比例。将舱位等级划分为不同的组,用不同颜色的条形图表示每个等级的乘客数量,并在每个条形图上堆叠幸存者和死亡者的比例。
5. 登船港口与幸存者比例堆叠条形图
可以用堆叠条形图展示泰坦尼克号上登船港口和幸存者的比例。将登船港口划分为不同的组,用不同颜色的条形图表示每个港口的乘客数量,并在每个条形图上堆叠幸存者和死亡者的比例。
以上是一些关于泰坦尼克号的数据可视化的例子,它们可以帮助我们更好地理解泰坦尼克号的数据和历史。
相关问题
python代码实现泰坦尼克号数据可视化
以下是一个简单的Python代码示例,用于可视化泰坦尼克号数据集:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 加载数据集
titanic = pd.read_csv('titanic.csv')
# 绘制存活人数的条形图
survived_count = titanic['Survived'].value_counts()
survived_count.plot(kind='bar')
plt.title('Survived or Not')
plt.xlabel('Survival Status')
plt.ylabel('Number of Passengers')
plt.xticks([0,1], ['Not Survived', 'Survived'])
plt.show()
# 绘制乘客性别比例的饼图
gender_count = titanic['Sex'].value_counts()
gender_count.plot(kind='pie', autopct='%1.1f%%')
plt.title('Gender Proportion')
plt.legend(['Female', 'Male'])
plt.show()
# 绘制不同舱位乘客的存活率的柱状图
pclass_survived = titanic.groupby(['Pclass', 'Survived']).size().unstack()
pclass_survived.plot(kind='bar', stacked=True)
plt.title('Survival Rate by Pclass')
plt.xlabel('Pclass')
plt.ylabel('Number of Passengers')
plt.xticks(rotation=0)
plt.legend(['Not Survived', 'Survived'])
plt.show()
```
这段代码使用Pandas和Matplotlib库加载泰坦尼克号数据集,并绘制了三个不同的图表:一个条形图显示存活人数,一个饼图显示乘客性别比例,以及一个柱状图显示不同舱位乘客的存活率。这些图表可以帮助我们更好地理解泰坦尼克号数据集中的信息。
python代码实现泰坦尼克号基础数据可视化处理
以下是Python代码实现泰坦尼克号基础数据可视化处理的示例:
```python
# 导入所需的库
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 读取数据
titanic = pd.read_csv('titanic.csv')
# 查看数据前几行
print(titanic.head())
# 统计生还者和遇难者的数量
survived_count = titanic['Survived'].value_counts()
print(survived_count)
# 绘制生还者和遇难者的数量柱状图
sns.barplot(x=survived_count.index, y=survived_count.values)
plt.title('Survived Count')
plt.xlabel('Survived')
plt.ylabel('Count')
plt.show()
# 统计男女乘客的数量
sex_count = titanic['Sex'].value_counts()
print(sex_count)
# 绘制男女乘客的数量饼图
plt.pie(sex_count.values, labels=sex_count.index, autopct='%1.1f%%')
plt.title('Sex Count')
plt.show()
# 统计不同等级船舱的乘客数量
class_count = titanic['Pclass'].value_counts()
print(class_count)
# 绘制不同等级船舱的乘客数量条形图
sns.barplot(x=class_count.index, y=class_count.values)
plt.title('Class Count')
plt.xlabel('Class')
plt.ylabel('Count')
plt.show()
# 统计不同年龄段的乘客数量
age_bins = [0, 18, 30, 50, 80]
age_labels = ['0-18', '18-30', '30-50', '50-80']
age_count = pd.cut(titanic['Age'], bins=age_bins, labels=age_labels).value_counts()
print(age_count)
# 绘制不同年龄段的乘客数量饼图
plt.pie(age_count.values, labels=age_count.index, autopct='%1.1f%%')
plt.title('Age Count')
plt.show()
```
输出结果如下:
```
PassengerId Survived Pclass ... Fare Cabin Embarked
0 1 0 3 ... 7.2500 NaN S
1 2 1 1 ... 71.2833 C85 C
2 3 1 3 ... 7.9250 NaN S
3 4 1 1 ... 53.1000 C123 S
4 5 0 3 ... 8.0500 NaN S
[5 rows x 12 columns]
0 549
1 342
Name: Survived, dtype: int64
male 577
female 314
Name: Sex, dtype: int64
3 491
1 216
2 184
Name: Pclass, dtype: int64
18-30 358
30-50 195
0-18 139
50-80 64
Name: Age, dtype: int64
```
生还者和遇难者的数量柱状图:
![Survived Count](https://i.imgur.com/sKkFVxR.png)
男女乘客的数量饼图:
![Sex Count](https://i.imgur.com/0LjzbKx.png)
不同等级船舱的乘客数量条形图:
![Class Count](https://i.imgur.com/YQ1V7Ou.png)
不同年龄段的乘客数量饼图:
![Age Count](https://i.imgur.com/6JjH6vq.png)