rstudio可视化泰坦尼克
时间: 2023-07-06 08:41:05 浏览: 109
泰坦尼克号数据可视化1
您好!关于使用RStudio进行泰坦尼克数据集的可视化,您可以按照以下步骤进行:
1. 导入数据集:在RStudio中使用read.csv()函数导入泰坦尼克数据集。
2. 数据清洗:对数据集进行清洗,去除缺失值、异常值等。
3. 数据可视化:使用ggplot2包进行数据可视化,例如画出存活人数与死亡人数的柱状图、绘制不同性别和等级的乘客的存活率等。
4. 分析结果:根据可视化结果进行分析和总结。
下面是一个简单的示例代码,供您参考:
```
# 导入数据集
titanic <- read.csv("titanic.csv")
# 数据清洗
titanic <- na.omit(titanic)
# 数据可视化
library(ggplot2)
# 存活人数与死亡人数的柱状图
ggplot(titanic, aes(x = Survived)) +
geom_bar()
# 不同性别和等级的乘客的存活率
ggplot(titanic, aes(x = factor(Pclass), fill = factor(Sex))) +
geom_bar(position = "dodge", aes(y = ..prop.., group = 1)) +
scale_y_continuous(labels = scales::percent) +
labs(title = "Survival Rate by Sex and Pclass",
x = "Pclass",
y = "Survival Rate")
# 分析结果
# 根据可视化结果分析不同性别和等级的乘客的存活率,可以发现女性和一等舱的乘客的存活率较高。
```
希望能对您有所帮助!
阅读全文