R语言如何对重复数据进行汇总
时间: 2023-06-26 16:09:21 浏览: 129
在R语言中,可以使用dplyr包进行数据处理和汇总。在处理重复数据时,可以使用dplyr中的group_by函数和summarize函数。
例如,假设我们有一个包含学生姓名和成绩的数据集,其中某些学生有多条记录,我们想对每个学生的成绩进行汇总。可以使用以下代码:
```
library(dplyr)
# 创建数据集
df <- data.frame(
name = c("Tom", "Jerry", "Tom", "Jerry", "Tom", "Jerry"),
score = c(80, 90, 85, 92, 88, 95)
)
# 按照姓名分组并计算平均成绩
df_summary <- df %>%
group_by(name) %>%
summarize(avg_score = mean(score))
# 输出结果
print(df_summary)
```
这段代码会将数据集按照姓名分组,并对每个组计算平均成绩,最终输出每个学生的平均成绩。
阅读全文