r语言titanic 用class绘制怕累托图
时间: 2024-11-22 20:44:32 浏览: 34
在R语言中,想要用`ggplot2`库来绘制泰坦尼克(Titanic)乘客存活情况的帕累托图(Pareto chart),你需要先加载必要的数据集,比如使用`tidyverse`包下的`readr`读取CSV文件。假设你的数据已经整理好,并且有一个名为`passengers`的数据框,其中包含survived列表示是否生存。
以下是步骤:
1. 首先安装并加载需要的库,如果还没有安装的话:
```bash
install.packages(c("tidyverse", "ggplot2"))
library(tidyverse)
```
2. 加载数据:
```R
data <- read_csv("your_titanic_data.csv") # 替换为实际数据文件路径
```
3. 创建一个计数表,计算各生存状态的数量:
```R
counts <- data %>%
group_by(survived) %>%
summarize(count = n())
```
4. 使用`ggplot2`绘制帕累托图:
```R
# 将幸存和未幸存的乘客数量转换为百分比
percent <- counts %>% mutate(pct = count / sum(count) * 100)
# 创建图形
pareto_plot <- ggplot(percent, aes(x = factor(c(0, pct$pct)), y = count, fill = survived)) +
geom_bar(stat = "identity", width = 1, position = "dodge") +
scale_fill_manual(values = c("#009E73", "#D55E00")) + # 设置颜色
labs(title = "泰坦尼克幸存者比例帕累托图",
x = "生存比例 (%)", y = "人数",
fill = "生存状况") +
coord_flip() # 将Y轴翻转,使图形看起来像帕累托图
pareto_plot
```
在这个例子中,我们画出了两个柱形,分别代表生还者和非生还者的乘客数量,横坐标是百分比,纵坐标是人数。如果你的数据存储结构或文件路径有误,记得相应地调整上述代码。
阅读全文