r 按某列分组统计个数 tapply
时间: 2023-11-23 19:03:35 浏览: 438
java8 集合 多字段 分组 统计个数代码
5星 · 资源好评率100%
在R中,可以使用tapply函数按照某一列来分组统计个数。
tapply函数的一般用法是:tapply(向量,分组依据,统计函数)。
其中,向量是需要进行分组统计的数据,分组依据是一个指定分组的变量,统计函数是对每个分组的数据进行统计的函数。
举个例子,假设有一个数据框df,其中有两列分别为"性别"和"年龄"。我们想按照性别来统计各个年龄段的人数。代码如下:
result <- tapply(df$年龄, df$性别, FUN = length)
这样,result就是一个以性别作为分组依据的统计结果。其中,每个性别对应的年龄段个数。
如果想要对两个及以上的列进行分组统计,可以使用逗号隔开,参考下面的代码:
result2 <- tapply(df$年龄, list(df$性别, df$学历), FUN = length)
这样,result2就是一个以性别和学历作为分组依据的统计结果。其中,每个性别和学历对应的年龄段个数。
总结一下,tapply函数是R中用于按照指定列分组统计的函数。它非常灵活,可以根据需要进行单列或多列的分组统计,可以使用各种各样的统计函数。
阅读全文