用R自带的数据集titanic绘制Class和Survived的南丁格尔玫瑰图
时间: 2024-11-09 13:30:21 浏览: 28
要在R语言中使用自带数据集`titanic`绘制反映船难中乘客生存情况的南丁格尔玫瑰图,首先你需要加载必要的库,然后对数据进行预处理,最后使用专门用于制作此类图表的`ggplot2`包来完成。以下是步骤:
1. **加载所需库**:
```R
library(ggplot2) # 主要用于绘图
library(dplyr) # 数据操作
```
2. **加载并查看数据集**:
```R
data(titanic)
head(titanic) # 查看前几行数据
```
确认`titanic`数据集中包含`Survived`(是否存活)和`Class`(社会阶层)这两个变量。
3. **数据预处理**:
选择需要的数据列,并整理成适合做玫瑰图的格式。例如:
```R
titanic_plot <- titanic %>%
filter(!is.na(Survived) & !is.na(Class)) %>%
group_by(Survived, Class) %>%
summarise(n = n())
```
这里我们筛选出无缺失值的Survived和Class,并按这两列分组计数。
4. **绘制南丁格尔玫瑰图**:
```R
ggplot(titanic_plot, aes(x = Class, y = Survived, fill = Survived)) +
geom_bar(stat = "identity", position = position_fill(reverse = TRUE)) +
labs(title = "Titanic幸存者按舱位分类",
x = "社会阶级",
y = "存活状态",
fill = "存活") +
theme_minimal() +
scale_fill_manual(values = c("white", "red")) # 设置颜色
```
这将生成一个南丁格尔玫瑰图,其中X轴代表社会阶级(Class),Y轴代表存活状态(Survived),填充颜色表示存活与否。
阅读全文