R检查丢失的数据

示例

anyNA报告是否存在任何缺失值;而按is.na元素报告缺失值:

vec <- c(1, 2, 3, NA, 5)

anyNA(vec)
# [1] TRUE
is.na(vec)
# [1] FALSE FALSE FALSE  TRUE FALSE

ìs.na返回在算术运算(FALSE = 0,TRUE = 1)下被强制为整数值的逻辑向量。我们可以使用它来找出有多少个缺失值:

sum(is.na(vec))
# [1] 1

扩展这种方法,我们可以在数据帧上使用colSums和is.na来计算每列的NA:

colSums(is.na(airquality))
#   OzoneSolar.R   Wind    Temp   Month     Day 
#      37       7       0       0       0       0

naniar软件包(当前在github上,但不在CRAN上)提供了更多工具来探索缺失值。