在 tableu中如何通过 survived来可视化获救与为获救的人数分布
时间: 2023-12-14 18:01:05 浏览: 103
在Tableau中,我们可以通过以下步骤来可视化获救与未获救的人数分布:
1. 打开Tableau软件并导入数据集。
2. 在数据源页面,选择需要使用的数据表,例如"乘客"。
3. 在工作表页面中,将"survived"字段拖放到列架构中。
4. 在"survived"字段旁边的标记卡中,选择柱状图。
5. 在行架构中,将"Number of Records"字段拖放到标记卡中的尺寸按钮上。
6. 右键点击"Number of Records"字段,选择"Measure",然后选择"Count"。
7. 现在,我们将看到一个由"survived"字段决定的柱状图,柱状图上显示了获救和未获救的人数。
如果想要进一步增强可视化效果,可以进行以下操作:
8. 在行架构中,将"survived"字段拖放到颜色按钮上。这将使得获救和未获救的柱子分别显示不同的颜色。
9. 在列架构中,将"Age"字段拖放到标记卡中的颜色按钮上。这将根据乘客的年龄对柱状图进行着色,使得我们能够了解不同年龄段的获救与未获救人数分布。
10. 根据需要,可以进一步添加其他字段到标记卡中进行更深入的分析和细化。
通过这种方式,我们可以在Tableau中可视化获救与未获救人数的分布,帮助我们更好地理解数据集中的获救情况。
相关问题
# 对单个特征Age和Survived关系进行可视化分析 import matplotlib.pyplot as plt import seaborn as sns sns.boxplot(x='Survived', y='Age', data=df2)详解代码
这段代码是用来对泰坦尼克号数据集中年龄(Age)这一特征与乘客生存(Survived)状况之间的关系进行可视化分析。下面是详细解释:
```python
import matplotlib.pyplot as plt
import seaborn as sns # 导入seaborn库,这是一个基于matplotlib的数据可视化库,提供更美观和高级的图形
# df2是已经处理过的数据框,包含Survived(生存状态,0表示未存活,1表示存活)和Age(年龄)这两列
sns.boxplot(x='Survived', y='Age', data=df2)
# x='Survived' 表示x轴是我们想要分析的变量,即乘客的生存状态(Survived列)
# y='Age' 表示y轴是我们正在可视化的特征,即乘客的年龄(Age列)
# data=df2 是指我们使用df2这个数据帧进行绘图
# "boxplot"函数生成了一个箱线图,它显示了每个Survived类别内年龄分布的五数概括(最小值、下四分位数、中位数、上四分位数、最大值),以及可能存在的异常值(箱外的点)。通过这个图表,我们可以直观地看出不同生存状态下乘客年龄的大致分布和是否存在显著差异。
# 例如,如果存活者(Survived=1)的箱形图位置整体偏右,说明存活者的平均年龄可能较高;反之则较低。
最后,plt.show()(在这里通常省略,因为seaborn会自动显示结果)用于显示绘制的图像。
根据数据文件titannic.zip,使用HIVE完成以下操作 统计获救与死亡情况 统计舱位分布情况 统计港口登船人数分布情况 统计性别与生存率的关系 统计客舱等级与生存率的关系 统计登船港口与生存率的关系
以下是使用Hive完成上述需求的代码:
1. 统计获救与死亡情况
```
SELECT
CASE WHEN survived = 1 THEN '获救' ELSE '死亡' END AS status,
COUNT(*) AS count
FROM titanic
GROUP BY survived;
```
2. 统计舱位分布情况
```
SELECT
pclass AS cabin_class,
COUNT(*) AS count
FROM titanic
GROUP BY pclass;
```
3. 统计港口登船人数分布情况
```
SELECT
CASE
WHEN embarked = 'C' THEN 'Cherbourg'
WHEN embarked = 'Q' THEN 'Queenstown'
WHEN embarked = 'S' THEN 'Southampton'
ELSE 'Unknown'
END AS port,
COUNT(*) AS count
FROM titanic
GROUP BY embarked;
```
4. 统计性别与生存率的关系
```
SELECT
sex,
AVG(survived) AS survival_rate
FROM titanic
GROUP BY sex;
```
5. 统计客舱等级与生存率的关系
```
SELECT
pclass AS cabin_class,
AVG(survived) AS survival_rate
FROM titanic
GROUP BY pclass;
```
6. 统计登船港口与生存率的关系
```
SELECT
CASE
WHEN embarked = 'C' THEN 'Cherbourg'
WHEN embarked = 'Q' THEN 'Queenstown'
WHEN embarked = 'S' THEN 'Southampton'
ELSE 'Unknown'
END AS port,
AVG(survived) AS survival_rate
FROM titanic
GROUP BY embarked;
```
阅读全文