rstudio 数据列名有下划线,按照列名下划线前的字符对列进行分组,按行加和
时间: 2024-10-25 08:05:39 浏览: 10
在RStudio中,如果你的数据框(`data frame`)的列名包含下划线 `_`,并且你想根据列名中下划线前的部分进行分组并计算每组的行求和,你可以使用`dplyr`包提供的功能,它非常方便处理这类操作。假设你有一个名为`df`的数据框,可以按照以下步骤操作:
```r
library(dplyr) # 首先确保已经安装了dplyr
# 假设你的数据框结构如下
# df <- data.frame(column_1 = ..., column_2 = ..., group_column = ...)
# 使用 `separate` 函数将列名拆分成两部分,保留下划线前的部分作为新的列
df_split <- df %>%
separate(colnames(.), into = c("group_key", "other"), sep = "_")
# 现在,"group_key"列就包含了下划线前的部分,你可以根据这个列进行分组
summarized_df <- df_split %>%
group_by(group_key) %>%
summarise_all(sum) # 对所有列求和
# 结果`summarized_df`将展示每个组内所有列的总和
```
在这个过程中,`summarize_all(sum)`会计算每一组中所有列的数值之和。如果你只想对特定类型的列(如数值列)求和,可以指定`summarise_all(~ ., numeric_only = TRUE)`。
阅读全文