要查找 R 数据框中大于 n 的重复行数,我们可以按照以下步骤操作 -
首先,创建一个数据框。
然后,使用 dplyr 包的 group_by_all、count 和 filter 函数计算大于某个数量的重复行。
让我们创建一个数据框,如下所示 -
x<-rpois(30,1) y<-rpois(30,1) df<-data.frame(x,y) df
执行时,上述脚本生成以下内容output(this output will vary on your system due to randomization)-
x y 1 1 3 2 0 2 3 0 2 4 0 2 5 2 1 6 1 0 7 0 0 8 1 2 9 1 2 10 2 1 11 0 3 12 1 1 13 1 1 14 0 0 15 0 0 16 0 1 17 0 0 18 0 1 19 0 1 20 2 0 21 1 2 22 3 1 23 1 0 24 1 0 25 1 3 26 1 0 27 1 1 28 2 1 29 1 2 30 0 4
加载 dplyr 包并使用 group_by_all、count 和 filter 函数来查找大于 2 的重复行数 -
x<-rpois(30,1) y<-rpois(30,1) df<-data.frame(x,y) library(dplyr) df%>%group_by_all()%>%count()%>%filter(n>2)
# A tibble: 7 x 3 # Groups: x, y [7] x y n <int> <int> <int> 1 0 0 4 2 0 1 3 3 0 2 3 4 1 0 4 5 1 1 3 6 1 2 4 7 2 1 3