在 tableu中如何通过 survived来可视化获救与为获救的人数分布
时间: 2023-12-14 17:01:05 浏览: 25
在Tableau中,我们可以通过以下步骤来可视化获救与未获救的人数分布:
1. 打开Tableau软件并导入数据集。
2. 在数据源页面,选择需要使用的数据表,例如"乘客"。
3. 在工作表页面中,将"survived"字段拖放到列架构中。
4. 在"survived"字段旁边的标记卡中,选择柱状图。
5. 在行架构中,将"Number of Records"字段拖放到标记卡中的尺寸按钮上。
6. 右键点击"Number of Records"字段,选择"Measure",然后选择"Count"。
7. 现在,我们将看到一个由"survived"字段决定的柱状图,柱状图上显示了获救和未获救的人数。
如果想要进一步增强可视化效果,可以进行以下操作:
8. 在行架构中,将"survived"字段拖放到颜色按钮上。这将使得获救和未获救的柱子分别显示不同的颜色。
9. 在列架构中,将"Age"字段拖放到标记卡中的颜色按钮上。这将根据乘客的年龄对柱状图进行着色,使得我们能够了解不同年龄段的获救与未获救人数分布。
10. 根据需要,可以进一步添加其他字段到标记卡中进行更深入的分析和细化。
通过这种方式,我们可以在Tableau中可视化获救与未获救人数的分布,帮助我们更好地理解数据集中的获救情况。
相关问题
使用seaborn绘制泰坦尼克号中票价区间对是否获救饼图
可以使用Seaborn库中的`pieplot`函数绘制饼图来表示不同票价区间的乘客在获救和未获救人数之间的比例。
以下是绘制泰坦尼克号中票价区间对是否获救饼图的示例代码:
```python
import seaborn as sns
import matplotlib.pyplot as plt
# 加载数据集
titanic = sns.load_dataset('titanic')
# 绘制饼图
fig, ax = plt.subplots(figsize=(8, 6))
sns.set_palette("pastel")
sns.set(style="whitegrid", font_scale=1.2)
# 按票价区间分组并计算各组乘客的获救人数
titanic['price_range'] = pd.cut(titanic['fare'], bins=[0, 20, 50, 100, 200, 1000])
survived_by_price = titanic.groupby('price_range')['survived'].value_counts().unstack()
# 绘制饼图
survived_by_price.plot(kind='pie', subplots=True, autopct='%1.1f%%', ax=ax, legend=False)
# 设置图形属性
ax.set_title('Survival Rate by Fare', fontsize=16)
ax.set_ylabel('')
ax.set_xlabel('')
# 显示图形
plt.show()
```
这段代码首先使用`pd.cut`函数按票价区间对乘客进行分组,并计算每个票价区间内的获救人数和未获救人数。然后,使用`plot`函数绘制饼图,并设置`autopct`参数来显示每个扇形区域所占的比例。最后,设置图形的标题、x轴标签和y轴标签,并显示图形。
根据年龄段,性别与客舱等级将数据可视化
好的,针对泰坦尼克号数据中的年龄段、性别与客舱等级,可以进行多维度的可视化分析,以探索不同人群的生存率、票价等情况。以下是一个简单的 Python 可视化代码示例,用于绘制不同年龄段、性别与客舱等级的生存率堆叠柱状图:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
df = pd.read_csv('train.csv')
# 数据清洗
df = df.dropna(subset=['Age']) # 删除年龄为空的行
df['AgeGroup'] = pd.cut(df['Age'], bins=[0, 18, 30, 50, 100], labels=['<18', '18-30', '30-50', '50+']) # 分组年龄段
# 计算生存率
survived = df.groupby(['Sex', 'Pclass', 'AgeGroup'])['Survived'].mean().unstack()
# 绘制堆叠柱状图
survived.plot(kind='bar', stacked=True)
plt.title('Survival Rate by Age Group, Sex and Class')
plt.xlabel('Age Group, Sex and Class')
plt.ylabel('Survival Rate')
plt.show()
```
这段代码将读取名为 `train.csv` 的泰坦尼克号数据集,并进行数据清洗和分组。然后,通过 `groupby` 函数,计算不同年龄段、性别与客舱等级的生存率,并将结果绘制为堆叠柱状图。通过调整 `bins` 参数和 `labels` 参数,可以控制年龄段的分组情况。通过修改和调整代码,可以进行更多维度的可视化分析。