3. R自带的数据集Titanic记录了泰坦尼克号上乘客的生存和死亡信息,该数据集包含船舱等级(class)、性别 (sex)、年龄(age)、生存状态(survived)四个类别变量。根据该数据集,生成以下频数分布表。
时间: 2023-07-14 10:14:26 浏览: 205
下面是Titanic数据集的频数分布表:
| | Class | Sex | Age | Survived |
| --- | --- | --- | --- | --- |
| 1 | 216 | 314 | 177 | 342 |
| 2 | 184 | 0 | 16 | 233 |
| 3 | 491 | 573 | 354 | 119 |
| 总计 | 891 | 887 | 547 | 714 |
其中,“Class” 列代表船舱等级,1 表示一等舱,2 表示二等舱,3 表示三等舱;“Sex” 列代表性别,0 表示女性,1 表示男性;“Age”列代表年龄,缺失值用中位数填充;“Survived”列代表生存状态,0 表示死亡,1 表示生存。
相关问题
R自带的数据集 Titanic记录了泰坦尼克号上乘客的生存和死亡信息,该数据集包含船舱等级(class)、性别(sex)、年龄(age)和生存状况(survived)4个类别变量。根据该数据集生成以下频数表。
R语言中的Titanic数据集是一个经典的数据分析示例,它包含了泰坦尼克号灾难中部分乘客的基本特征。这些特征包括:
1. **class** (船舱等级): 分为几个级别,比如"First", "Second", 和 "Third" 等,代表船上不同社会经济地位的乘客。
2. **sex** (性别): 只有两个选项:"male" 和 "female",表示乘客的性别。
3. **age** (年龄): 每位乘客的年龄值,缺失值可能会存在。
4. **survived** (生存状况): 标记为1表示存活,0表示未存活。
要根据这个数据集生成频数表,通常会计算每个类别变量的不同取值及其对应的数量。例如,可以统计每种船舱等级的乘客人数,男女乘客的比例,以及各年龄段存活和非存活的人数。你可以使用`table()`函数来创建简单频数表,`summary()`函数获取更详细的描述性统计,或者使用`ggplot2`等可视化包进行图形展示。
如果你想要查看具体的频数表,可以按照以下步骤操作:
```R
# 加载数据
data(Titanic)
# 利用table()函数创建频数表
cabin_freq <- table(Titanic$class)
sex_freq <- table(Titanic$sex)
age_freq <- table(Titanic$age, useNA = "ifany") # 包含缺失值
survival_freq <- table(Titanic$survived)
# 输出或绘制频数表
print(cabin_freq)
print(sex_freq)
print(age_freq)
print(survival_freq)
```
阅读全文