在R的faraway包中有一个名为worldcup的数据集,该数据集是2010年世界杯球员的数据,利用dplyr包的函数完成如下操作: (1)选择Team、Position、Shots变量数据,赋值给worldcup1; (2)将worldcup1按照Team升序排列,并赋值给worldcup2; (3)筛选巴西队(Team为Brazil)所有球员数据,赋值给worldcup3; (4)按Team统计Shots、Passes、Tackles、Saves的总和。
时间: 2024-02-26 17:57:08 浏览: 82
fifa数据集-数据集
可以使用以下代码完成上述操作:
```R
library(dplyr)
library(faraway)
# (1) 选择Team、Position、Shots变量数据,赋值给worldcup1
worldcup1 <- select(worldcup, Team, Position, Shots)
# (2) 将worldcup1按照Team升序排列,并赋值给worldcup2
worldcup2 <- arrange(worldcup1, Team)
# (3) 筛选巴西队(Team为Brazil)所有球员数据,赋值给worldcup3
worldcup3 <- filter(worldcup, Team == "Brazil")
# (4) 按Team统计Shots、Passes、Tackles、Saves的总和
worldcup4 <- group_by(worldcup, Team) %>%
summarize(Shots = sum(Shots), Passes = sum(Passes), Tackles = sum(Tackles), Saves = sum(Saves))
```
解释一下代码:
- `select()` 函数用于选择数据集中的变量;
- `arrange()` 函数用于按照指定变量升序或降序排列;
- `filter()` 函数用于筛选数据集中符合条件的行;
- `group_by()` 函数用于按照指定变量分组;
- `%>%` 是管道操作符,用于将前一个函数的输出作为后一个函数的输入;
- `summarize()` 函数用于对分组后的变量进行统计计算,如求和、均值等。
阅读全文