在R中使用dplyr的group_by时如何使用列索引而不是列名？

当我们使用dplyr包的group_by函数时，我们需要传递name(s)本质上属于分类的列。如果要使用相同的索引，column(s)则需要使用group_by_at函数，在此我们可以将列索引作为参数传递。

例1

考虑以下数据帧-

x1<−sample(LETTERS[1:4],20,replace=TRUE)
x2<−rpois(20,2)
df1<−data.frame(x1,x2)
df1

输出结果

加载dplyr软件包并使用列索引而不是列名-

示例

library(dplyr)
df1%>%group_by_at(1)%>%summarise(n=n())
`summarise()` ungrouping output (override with `.groups` argument)

输出结果

# A tibble: 4 x 2
x1 n
< chr> <int>
1 A 2
2 B 6
3 C 5
4 D 7

例2

y1<−sample(c("Male","Female"),20,replace=TRUE)
y2<−sample(21:50,20)
df2<−data.frame(y1,y2)
df2

输出结果

y1 y2
1 Female 29
2 Male 43
3 Female 34
4 Male 49
5 Male 28
6 Female 23
7 Female 27
8 Female 31
9 Female 36
10 Female 41
11 Male 25
12 Female 24
13 Male 30
14 Female 22
15 Female 37
16 Male 42
17 Female 47
18 Male 35
19 Female 32
20 Female 21

使用列索引而不是列名称来汇总y1-

示例

df2%>%group_by_at(1)%>%summarise(n=n())
`summarise()` ungrouping output (override with `.groups` argument)

输出结果

# A tibble: 2 x 2
y1 n
<chr> <int>
1 Female 13
2 Male 7

基础教程