如何基于R中另一个数据帧的列值提取数据帧的列值?

在数据分析中,我们会遇到许多变化很大的问题。这样的问题之一是我们在某个地方有一些信息,需要通过另一个地方检查这些信息,这些地方可以是数据帧。因此,我们可以基于另一个数据帧的列值来查找数据帧的列值。在R中,我们可以借助哪个函数轻松地做到这一点。

示例

请看以下数据帧-

set.seed(12121)
x1<−sample(0:2,20,replace=TRUE)
y1<−sample(0:5,20,replace=TRUE)
df1<−data.frame(x1,y1)
df1

输出结果

x1 y1
1 0 3
2 2 2
3 0 2
4 1 4
5 0 4
6 2 0
7 0 3
8 0 1
9 2 5
10 1 0
11 0 1
12 1 1
13 0 3
14 0 0
15 2 0
16 1 5
17 0 2
18 2 0
19 1 4
20 0 5

示例

x2<−sample(1:2,20,replace=TRUE)
y2<−sample(1:5,20,replace=TRUE)
df2<−data.frame(x2,y2)
df2

输出结果

x2 y2
1 1 2
2 1 2
3 1 2
4 2 4
5 2 3
6 1 4
7 2 1
8 2 3
9 1 2
10 1 5
11 1 2
12 2 2
13 2 1
14 2 5
15 1 2
16 1 3
17 2 2
18 2 1
19 1 1
20 1 3

在df2的x2中找到df1的x1中的值-

df1[which(df1$x1 %in% df2$x2), "x1"]
[1] 2 1 2 2 1 1 2 1 2 1

在df1的y2中找到df1的y1中的值-

df1[which(df1$y1 %in% df2$y2), "y1"]
[1] 3 2 2 4 4 3 1 5 1 1 3 5 2 4 5

让我们看另一个例子-

x3<−sample(21:25,20,replace=TRUE)
y3<−sample(26:50,20)
df3<−data.frame(x3,y3)
df3

输出结果

  x3 y3
1 21 39
2 24 36
3 24 31
4 22 46
5 25 27
6 24 29
7 24 30
8 23 26
9 24 45
10 22 37
11 23 35
12 23 43
13 22 38
14 22 32
15 25 49
16 23 44
17 24 34
18 21 40
19 21 47
20 25 42

示例

x4<−sample(24:25,20,replace=TRUE)
y4<−sample(41:50,20,replace=TRUE)
df4<−data.frame(x4,y4)
df4

输出结果

  x4 y4
1 25 50
2 24 44
3 24 45
4 25 49
5 24 42
6 25 48
7 25 43
8 25 47
9 24 50
10 25 41
11 25 47
12 25 50
13 24 46
14 25 50
15 24 42
16 24 42
17 24 50
18 25 47
19 25 42
20 25 41
df3[which(df3$x3 %in% df4$x4), "x3"]
[1] 24 24 25 24 24 24 25 24 25
df3[which(df3$y3 %in% df4$y4), "y3"]
[1] 46 45 43 49 44 47 42
猜你喜欢