从国家统计局官网下载近二十年旅客运距数据csv文件,用R语言对其进行数据分析,要求有绘图,包括直方图饼图散点图等基本图形,有代码
时间: 2024-03-30 17:38:56 浏览: 18
好的,以下是对于这个问题的回答,包括对数据进行基本探索性分析和绘制常用的图形。
1. 下载数据文件
从国家统计局官网下载近二十年旅客运距数据csv文件,方法如上面所述。
2. 导入数据文件
使用R语言的read.csv函数读取下载下来的数据文件,代码如下:
```{r}
library(tidyverse)
data <- read.csv("路径/文件名.csv", header = TRUE, encoding = "UTF-8")
```
3. 探索性分析
接下来对数据进行初步的探索性分析,包括以下几个方面:
- 查看数据结构和摘要
- 查看数据的分布情况
- 查看数据的相关性
代码如下:
```{r}
# 查看数据结构和摘要
str(data)
summary(data)
# 查看数据的分布情况
ggplot(data, aes(x = 旅客运距)) +
geom_histogram(binwidth = 500) +
labs(title = "旅客运距分布直方图", x = "旅客运距", y = "频数")
# 查看数据的相关性
ggplot(data, aes(x = 年份, y = 旅客运距)) +
geom_point() +
geom_smooth(method = "lm") +
labs(title = "年份与旅客运距相关性分析", x = "年份", y = "旅客运距")
```
4. 绘制基本图形
接下来我们绘制基本的图形,包括直方图、饼图、散点图等。代码如下:
```{r}
# 直方图
ggplot(data, aes(x = 旅客运距)) +
geom_histogram(binwidth = 500) +
labs(title = "旅客运距分布直方图", x = "旅客运距", y = "频数")
# 饼图
data %>%
group_by(类型) %>%
summarise(count = n()) %>%
ggplot(aes(x = "", y = count, fill = 类型)) +
geom_bar(stat = "identity", width = 1) +
coord_polar(theta = "y") +
labs(title = "旅客运距数据分类情况", fill = "类型")
# 散点图
ggplot(data, aes(x = 年份, y = 旅客运距)) +
geom_point() +
geom_smooth(method = "lm") +
labs(title = "年份与旅客运距相关性分析", x = "年份", y = "旅客运距")
```
希望这个回答能够帮到你,如果还有其他问题,欢迎继续提问。