r语言summarise
时间: 2023-11-30 19:04:02 浏览: 67
summarise函数是dplyr包中的一个函数,用于对数据进行汇总、分组和计算汇总统计信息。该函数可以对数据框进行分组并计算每个组的汇总统计量,并返回一个新的数据框,其中包含每个组的汇总统计量。
summarise函数的语法如下:
summarise(data, variable = function)
其中,data是要进行汇总的数据框,variable是要进行计算的变量名或表达式,function是要进行计算的函数。
例如,以下代码使用summarise函数对iris数据集中的花瓣长度进行分组,并计算每组的均值和标准差:
```
library(dplyr)
data(iris)
iris_summary <- iris %>%
group_by(Species) %>%
summarise(mean = mean(Petal.Length), sd = sd(Petal.Length))
```
输出结果如下:
```
# A tibble: 3 x 3
Species mean sd
<fct> <dbl> <dbl>
1 setosa 1.46 0.174
2 versicolor 4.26 0.470
3 virginica 5.55 0.552
```
以上代码首先使用group_by函数按照花卉的种类对数据框进行分组,然后使用summarise函数计算每个组的均值和标准差,并返回一个新的数据框。
相关问题
r语言 summarise函数
R语言中,summarise函数是dplyr包中的一个函数,用于对数据进行聚合操作,返回一个新的数据集。其语法格式如下:
summarise(.data, col_name = function(x) { ... })
其中,.data表示要进行聚合操作的数据集,col_name表示要生成的新列名,function(x)表示要对数据进行的聚合操作,可以是任意R函数。
例如,对某个数据集df中的变量var1进行求和操作,可以使用如下代码:
```
library(dplyr) # 加载dplyr包
new_df <- df %>% summarise(sum_var1 = sum(var1))
```
这段代码中,%>%符号表示管道操作,将原数据集df传入summarise函数中进行聚合操作,生成一个新的数据集new_df,其中包含一列名为sum_var1,存储了var1变量的求和结果。
r语言summarise函数怎么用
summarise函数可以用于对数据进行统计汇总,比如求总和、平均数等。 语法如下:
summarise(data, 统计量1 = 函数1(变量1), 统计量2 = 函数2(变量2), ...)
其中,data为要统计的数据集,统计量1、统计量2等为需要计算的统计量名称,函数1、函数2为对应的计算统计量的函数,变量1、变量2为需要参与计算的变量。
例如,我们有一个数据集df,其中包含"年龄"、"性别"和"收入"三个变量,如果要对"收入"进行总和统计,可以使用以下代码:
sum_df <- df %>% summarise(total_income = sum(收入))
这里用到的函数是sum(),表示对"收入"变量求和。最后的结果会生成一个新的数据框"sum_df",其中包含一个名为"total_income"的计算结果,即"收入"的总和。
阅读全文