r语言summarise函数怎么用
时间: 2023-06-02 20:07:17 浏览: 160
summarise函数可以用于对数据进行统计汇总,比如求总和、平均数等。 语法如下:
summarise(data, 统计量1 = 函数1(变量1), 统计量2 = 函数2(变量2), ...)
其中,data为要统计的数据集,统计量1、统计量2等为需要计算的统计量名称,函数1、函数2为对应的计算统计量的函数,变量1、变量2为需要参与计算的变量。
例如,我们有一个数据集df,其中包含"年龄"、"性别"和"收入"三个变量,如果要对"收入"进行总和统计,可以使用以下代码:
sum_df <- df %>% summarise(total_income = sum(收入))
这里用到的函数是sum(),表示对"收入"变量求和。最后的结果会生成一个新的数据框"sum_df",其中包含一个名为"total_income"的计算结果,即"收入"的总和。
相关问题
r语言summarise
summarise函数是dplyr包中的一个函数,用于对数据进行汇总、分组和计算汇总统计信息。该函数可以对数据框进行分组并计算每个组的汇总统计量,并返回一个新的数据框,其中包含每个组的汇总统计量。
summarise函数的语法如下:
summarise(data, variable = function)
其中,data是要进行汇总的数据框,variable是要进行计算的变量名或表达式,function是要进行计算的函数。
例如,以下代码使用summarise函数对iris数据集中的花瓣长度进行分组,并计算每组的均值和标准差:
```
library(dplyr)
data(iris)
iris_summary <- iris %>%
group_by(Species) %>%
summarise(mean = mean(Petal.Length), sd = sd(Petal.Length))
```
输出结果如下:
```
# A tibble: 3 x 3
Species mean sd
<fct> <dbl> <dbl>
1 setosa 1.46 0.174
2 versicolor 4.26 0.470
3 virginica 5.55 0.552
```
以上代码首先使用group_by函数按照花卉的种类对数据框进行分组,然后使用summarise函数计算每个组的均值和标准差,并返回一个新的数据框。
r语言group_by函数
R语言中的group_by函数是用于按照某个变量对数据进行分组的函数。它可以与mutate()、arrange()和summarise()等函数结合使用,对数据集进行分组操作。下面是一个示例:
假设我们有一个数据集mtcars,其中包含了汽车的各种属性,如mpg、cyl、disp等。我们可以使用group_by函数按照cyl变量对数据进行分组,并计算每组中disp和hp的平均值。
```R
library(dplyr)
mtcars %>%
group_by(cyl) %>%
summarise(disp = mean(disp), hp = mean(hp))
```
上述代码中,首先使用library函数加载dplyr包,然后使用%>%符号将mtcars数据集传递给group_by函数,按照cyl变量进行分组。接着使用summarise函数计算每组中disp和hp的平均值,并将结果存储在新的数据集中。
阅读全文