熊猫系列中的计数方法有什么作用?

pandas 系列中的 count 方法将返回一个整数值,该值表示系列对象中存在的元素总数。它只计算有效元素并忽略系列数据中的无效元素。

无效元素只不过是缺失值,如 Nan、Null 和 None。count 方法不会将缺失值计算为一个元素,它会忽略缺失值并计算剩余值。

示例

# importing pandas packages
import pandas as pd

d = {'a':'A','c':"C",'d':'D','e':'E'}

#creating a series with null data
s_obj = pd.Series(d, index=list('abcdefg'))

print(s_obj)

# using count method
print('\nResult',s_obj.count())

解释

我们使用带有文本类型元素的python 字典创建了一个pandas 系列对象,在创建系列对象时,我们通过使用新的索引标签指定索引属性来添加一些Nan 数据(空值)。那些新添加的索引标签没有任何特定数据,因此它将在该索引位置创建一个空元素。

输出结果

a    A
b  NaN
c    C
d    D
e    E
f  NaN
g  NaN
dtype: object

Result 4

我们可以在上面的输出块中看到熊猫系列对象“s_obj”。有 7 个索引和值对,其中 3 个缺失值表示为 NaN。

我们可以在上面的块中看到pandas系列的count方法的输出,即“Result 4”。这意味着,我们的系列对象 s_obj 中只有 4 个有效元素,其余所有元素都是无效元素。

示例

# importing pandas packages
import pandas as pd
import numpy as np


#creating a series with null data
s_obj = pd.Series([2, 9, 6, None, 5, 9, np.nan])

print(s_obj)

# using count method
print('\nValues count:',s_obj.count())

解释

在以下示例中,我们使用 Python 列表创建了另一个带有一些缺失值的 Pandas 系列对象。在该列表中,共有 7 个元素和两个缺失元素。一个缺失的元素由 python None 关键字创建,另一个元素由 NumPy 属性 nan 创建。

输出结果

0   2.0
1   9.0
2   6.0
3   NaN
4   5.0
5   9.0
6   NaN
dtype: float64

Values count: 5

我们可以看到系列对象 's_obj' 和 count 方法的输出。这里有来自 7 元素系列对象的 5 个有效元素。