r语言titanic
时间: 2023-10-01 19:11:17 浏览: 197
r language
R语言的Titanic数据集记录了泰坦尼克号上乘客的生存和死亡信息。该数据集包含了船舱等级(class)、性别(sex)、年龄(age)和生存状态(survived)等四个类别变量。根据该数据集,可以生成频数分布表来展示各个变量的统计信息。
在R中,可以使用以下代码生成频数分布表:
```R
library(titanic) # 加载Titanic数据集
data <- as.data.frame(Titanic) # 转换为数据框
# 生成性别和生存状态的频数分布表
freq_table <- xtabs(Freq ~ Sex + Survived, data = data)
freq_table_with_margins <- addmargins(freq_table)
# 生成船舱等级、性别、年龄和生存状态的频数分布表
all_freq_table <- xtabs(Freq ~ Class + Sex + Age + Survived, data = data)
as.data.frame.array(all_freq_table)
```
以上代码会生成两个频数分布表,一个是性别和生存状态的频数分布表,另一个是包含船舱等级、性别、年龄和生存状态的频数分布表。你可以根据自己的需要来选择相应的变量进行统计分析。
阅读全文