在数据分析中,我们会遇到许多变化很大的问题。这样的问题之一是我们在某个地方有一些信息,需要通过另一个地方检查这些信息,这些地方可以是数据帧。因此,我们可以基于另一个数据帧的列值来查找数据帧的列值。在R中,我们可以借助哪个函数轻松地做到这一点。
请看以下数据帧-
set.seed(12121) x1<−sample(0:2,20,replace=TRUE) y1<−sample(0:5,20,replace=TRUE) df1<−data.frame(x1,y1) df1
输出结果
x1 y1 1 0 3 2 2 2 3 0 2 4 1 4 5 0 4 6 2 0 7 0 3 8 0 1 9 2 5 10 1 0 11 0 1 12 1 1 13 0 3 14 0 0 15 2 0 16 1 5 17 0 2 18 2 0 19 1 4 20 0 5
x2<−sample(1:2,20,replace=TRUE) y2<−sample(1:5,20,replace=TRUE) df2<−data.frame(x2,y2) df2
输出结果
x2 y2 1 1 2 2 1 2 3 1 2 4 2 4 5 2 3 6 1 4 7 2 1 8 2 3 9 1 2 10 1 5 11 1 2 12 2 2 13 2 1 14 2 5 15 1 2 16 1 3 17 2 2 18 2 1 19 1 1 20 1 3
在df2的x2中找到df1的x1中的值-
df1[which(df1$x1 %in% df2$x2), "x1"] [1] 2 1 2 2 1 1 2 1 2 1
在df1的y2中找到df1的y1中的值-
df1[which(df1$y1 %in% df2$y2), "y1"] [1] 3 2 2 4 4 3 1 5 1 1 3 5 2 4 5
让我们看另一个例子-
x3<−sample(21:25,20,replace=TRUE) y3<−sample(26:50,20) df3<−data.frame(x3,y3) df3
输出结果
x3 y3 1 21 39 2 24 36 3 24 31 4 22 46 5 25 27 6 24 29 7 24 30 8 23 26 9 24 45 10 22 37 11 23 35 12 23 43 13 22 38 14 22 32 15 25 49 16 23 44 17 24 34 18 21 40 19 21 47 20 25 42
x4<−sample(24:25,20,replace=TRUE) y4<−sample(41:50,20,replace=TRUE) df4<−data.frame(x4,y4) df4
输出结果
x4 y4 1 25 50 2 24 44 3 24 45 4 25 49 5 24 42 6 25 48 7 25 43 8 25 47 9 24 50 10 25 41 11 25 47 12 25 50 13 24 46 14 25 50 15 24 42 16 24 42 17 24 50 18 25 47 19 25 42 20 25 41 df3[which(df3$x3 %in% df4$x4), "x3"] [1] 24 24 25 24 24 24 25 24 25 df3[which(df3$y3 %in% df4$y4), "y3"] [1] 46 45 43 49 44 47 42