如何计算 Python Pandas DataFrame 列中的 NaN 值?

要计算 Pandas DataFrame 中列中的 NaN 值,我们可以使用sumisna()方法。

步骤

  • 创建一个带有轴标签(包括时间序列)的一维ndarray序列s

  • 打印系列,s

  • 计算系列中存在的 NaN 数量。

  • 创建二维、大小可变、潜在异构的表格数据df

  • 打印输入数据帧。

  • 按列查找 NaN 计数。

  • 打印计数数据帧。

示例

import pandas as pd
import numpy as np

s = pd.Series([1, np.nan, 3, np.nan, 3, np.nan, 7, np.nan, 3])
print "Input series is:\n", s
count = s.isna().sum()
print "NAN 串联计数: ", count

df = pd.DataFrame(
   {
      "x": [5, np.nan, 1, np.nan],
      "y": [np.nan, 1, np.nan, 10],
      "z": [np.nan, 1, np.nan, np.nan]
   }
)
print "\nInput DataFrame is:\n", df
count = df.isna().sum()
print "\nNAN count in DataFrame:\n", count
输出结果
Input series is:
0  1.0
1  NaN
2  3.0
3  NaN
4  3.0
5  NaN
6  7.0
7  NaN
8  3.0
dtype: float64
NAN 串联计数: 4

Input DataFrame is:
    x    y    z
0  5.0  NaN  NaN
1  NaN  1.0  1.0
2  1.0  NaN  NaN
3  NaN  10.0 NaN

NAN count in DataFrame:
x  2
y  2
z  3
dtype: int64