R自带的数据集 Titanic记录了泰坦尼克号上乘客的生存和死亡信息,该数据集包含船舱等级(class)、性别(sex)、年龄(age)和生存状况(survived)4个类别变量。根据该数据集生成以下频数表。
时间: 2024-09-30 14:13:03 浏览: 62
R语言中的Titanic数据集是一个经典的数据分析示例,它包含了泰坦尼克号灾难中部分乘客的基本特征。这些特征包括:
1. **class** (船舱等级): 分为几个级别,比如"First", "Second", 和 "Third" 等,代表船上不同社会经济地位的乘客。
2. **sex** (性别): 只有两个选项:"male" 和 "female",表示乘客的性别。
3. **age** (年龄): 每位乘客的年龄值,缺失值可能会存在。
4. **survived** (生存状况): 标记为1表示存活,0表示未存活。
要根据这个数据集生成频数表,通常会计算每个类别变量的不同取值及其对应的数量。例如,可以统计每种船舱等级的乘客人数,男女乘客的比例,以及各年龄段存活和非存活的人数。你可以使用`table()`函数来创建简单频数表,`summary()`函数获取更详细的描述性统计,或者使用`ggplot2`等可视化包进行图形展示。
如果你想要查看具体的频数表,可以按照以下步骤操作:
```R
# 加载数据
data(Titanic)
# 利用table()函数创建频数表
cabin_freq <- table(Titanic$class)
sex_freq <- table(Titanic$sex)
age_freq <- table(Titanic$age, useNA = "ifany") # 包含缺失值
survival_freq <- table(Titanic$survived)
# 输出或绘制频数表
print(cabin_freq)
print(sex_freq)
print(age_freq)
print(survival_freq)
```
阅读全文