如何删除R数据帧列中连续重复的重复项？

通常会重复使用会在数据中产生重复的值，并且如果它们不太可能在分析的输出中造成偏差，我们可能希望摆脱这些值。例如，如果我们有一列定义一个流程，并且我们对该流程的输出进行五次操作，但一直都采用相同的输出，那么我们可能只想使用一个输出。

例1

请看以下数据帧-

ID<−1:20
x<−sample(0:2,20,replace=TRUE)
df1<−data.frame(ID,x)
df1

输出结果

删除df1列中连续重复的重复项x-

Repeated1<−cumsum(rle(as.character(df1$x))$length)
df1[Repeated1,]

输出结果

例2

ID<−1:20
y<−sample(1:5,20,replace=TRUE)
df2<−data.frame(ID,y)
df2

输出结果

删除df2列y中连续重复的重复项-

Repeated2<−cumsum(rle(as.character(df2$y))$length)
df2[Repeated2,]

输出结果

例子3

ID<−1:20
z<−sample(11:13,20,replace=TRUE)
df3<−data.frame(ID,z)
df3

输出结果

在df3列z中删除连续重复的重复项-

Repeated3<−cumsum(rle(as.character(df3$z))$length)
df3[Repeated3,]

输出结果

基础教程