在调查或任何其他数据收集媒介期间,无法从所有单位获取所有信息。有时我们得到部分信息,有时什么也没有。因此,数据中的某些行可能完全为空白,而某些行可能具有部分数据。可以删除空白行,并使用有助于处理缺失信息的方法填充其他空值。
考虑下面的数据框,它缺少一些行和一些值-
> x1<-c(rep(c(1,2,3),times=5),"","","",2,1) > x2<-rep(c(2,4,"",4,""),each=4) > x3<-rep(c(5,4,2,""),times=c(2,5,3,10)) > df<-data.frame(x1,x2,x3) > df x1 x2 x3 1 1 2 5 2 2 2 5 3 3 2 4 4 1 2 4 5 2 4 4 6 3 4 4 7 1 4 4 8 2 4 2 9 3 2 10 1 2 11 2 12 3 13 1 4 14 2 4 15 3 4 16 4 17 18 19 2 20 1
在这里,我们可以看到第17和18行完全为空白,这意味着我们中没有任何数据。因此,我们可以将它们从数据框中删除,如下所示-
> df[!apply(df == "", 1, all),] x1 x2 x3 1 1 2 5 2 2 2 5 3 3 2 4 4 1 2 4 5 2 4 4 6 3 4 4 7 1 4 4 8 2 4 2 9 3 2 10 1 2 11 2 12 3 13 1 4 14 2 4 15 3 4 16 4 19 2 20 1