在数据分析中,我们会遇到许多变化很大的问题。这样的问题之一是我们在某个地方有一些信息,需要通过另一个地方检查这些信息,这些地方可以是数据帧。因此,我们需要根据另一个数据帧的列值找到数据帧的列值的位置。在R中,我们可以借助哪个函数轻松地做到这一点。
请看以下数据帧-
set.seed(12121) x1<−sample(0:2,20,replace=TRUE) y1<−sample(0:5,20,replace=TRUE) df1<−data.frame(x1,y1) df1
输出结果
x1 y1 1 0 3 2 2 2 3 0 2 4 1 4 5 0 4 6 2 0 7 0 3 8 0 1 9 2 5 10 1 0 11 0 1 12 1 1 13 0 3 14 0 0 15 2 0 16 1 5 17 0 2 18 2 0 19 1 4 20 0 5
x2<−sample(1:2,20,replace=TRUE) y2<−sample(1:5,20,replace=TRUE) df2<−data.frame(x2,y2) df2
输出结果
x2 y2 1 1 2 2 1 2 3 1 2 4 2 4 5 2 3 6 1 4 7 2 1 8 2 3 9 1 2 10 1 5 11 1 2 12 2 2 13 2 1 14 2 5 15 1 2 16 1 3 17 2 2 18 2 1 19 1 1 20 1 3
在df2的x2中找到df1的x1的位置-
which(df1$x1 %in% df2$x2)
输出结果
[1] 2 4 6 9 10 12 15 16 18 19
在df2的y2中找到df1的y1的位置-
which(df1$y1 %in% df2$y2)
输出结果
[1] 1 2 3 4 5 7 8 9 11 12 13 16 17 19 20
让我们看另一个例子-
x3<−sample(21:25,20,replace=TRUE) y3<−sample(26:50,20) df3<−data.frame(x3,y3) df3
输出结果
x3 y3 1 21 39 2 24 36 3 24 31 4 22 46 5 25 27 6 24 29 7 24 30 8 23 26 9 24 45 10 22 37 11 23 35 12 23 43 13 22 38 14 22 32 15 25 49 16 23 44 17 24 34 18 21 40 19 21 47 20 25 42
x4<−sample(24:25,20,replace=TRUE) y4<−sample(41:50,20,replace=TRUE) df4<−data.frame(x4,y4) df4
输出结果
x4 y4 1 25 50 2 24 44 3 24 45 4 25 49 5 24 42 6 25 48 7 25 43 8 25 47 9 24 50 10 25 41 11 25 47 12 25 50 13 24 46 14 25 50 15 24 42 16 24 42 17 24 50 18 25 47 19 25 42 20 25 41 which(df3$x3 %in% df4$x4) [1] 2 3 5 6 7 9 15 17 20 which(df3$y3 %in% df4$y4) [1] 4 9 12 15 16 19 20