Pandas 系列是带有标记数据的一维 ndarray,这意味着系列中存在的每个值都有一个标签表示,它只是每个数据都有索引值。
索引可以是标签名称(对象数据),也可以是值。默认情况下,它会分配一个 0 - n-1 的索引值(n 是系列值的长度)。它具有定义索引值的能力。
Pandas Series 函数有一个用于指定索引值的 index 关键字,它将输入作为包含任何类型数据的数组。数据可以是整数、浮点数、文本数据、日期时间等。
让我们看看如何在创建系列时指定索引值。
import pandas as pd Countries = ['Australia', 'Iceland', 'India', 'United Kingdom', 'United States'] Capitals = ['Canberra', 'Reykjavik', 'New Delhi', 'London', 'Washington D.C'] # create series s = pd.Series(Capitals, index=Countries) print(s)
上面这段代码的预期结果是一个带有标记索引和文本数据的熊猫系列。这里的索引值是一些国家的名称列表,数据是这些国家的首都城市。
我们创建了一个包含国家名称和首都城市名称的双 Python 列表。并发送了那两个列表pandas Series Contractor(函数)。首都名称是系列数据,国家名称是索引。pd.Series()
指定索引名称可以通过为pandas Series函数的index关键字分配一个python列表(国家列表)来实现。这里我们应该记住的一件事是索引数据的长度必须与系列数据的长度相同。否则,它将引发 ValueError。
输出结果
Australia Canberra Iceland Reykjavik India New Delhi United Kingdom London United States Washington D.C dtype: object
上述输出块中存在的索引和值都是对象数据类型。在上面的例子中,我们在创建系列时单独指定了索引标签。
# importing pandas packages import pandas as pd dictionary = {'a':'A','c':"C",'d':'D','e':'E'} #creating a series with null data s_obj = pd.Series(dictionary) print(s_obj)
如果我们使用 python 字典作为 pandas Series 构造函数的数据,那么它将把字典的键作为索引和值作为系列对象的元素。
输出结果
a A c C d D e E dtype: object
我们可以使用 python 字典的键来指定系列对象的索引。