Pandas 中的数据表如何表示?

为了在 Pandas 中表示数据表,我们在 Pandas 中有一个类似表的对象,它是 DataFrame。DataFrame 是 Pandas 中的二维数据结构,这些数据结构可以以列和行的方式存储任何类型的数据。

示例

df = pd.DataFrame({"Name": [ "Harris","William","Elizabeth",],"Age": [22, 35, 58],"Sex": ["male", "male", "female"],})
print(df)

解释

这里我们使用DataFrame对象在pandas中手动创建了一个数据表,数据是一个列表字典。在创建表格数据时,我们只提到了列标签,但还提到了任何行标签(索引值)。但是您可以在下面的输出块中看到标签值。

输出结果

       Name Age  Gender
0    Harris 22   male
1   William 35   male
2 Elizabeth 58 female

在输出数据表中,共有 3 列标记有 Name、Age 和 Gender 名称,还有 3 行标记有 0、1、2 索引值。这些索引值是自动创建的值,列名由 显式定义use(keys names in our dictionary as column names)。

我们可以看到 Pandas DataFrame 创建的数据表看起来与电子表格和 SQL 表非常相似。

DataFrame 中的每一列都是一个 pandas Series 对象。它只有一列和多行带有索引标签。

示例

print(df.Name)

解释

我们可以使用df.name列语法从我们的 DataFrame (df) 中获取单个列名。由此产生的熊猫系列对象可以在下面看到。

输出结果

0    Harris
1   William
2 Elizabeth
Name: Name, dtype: object

来自表格数据 (df) 名称列的 3 行数据。本系列的数据类型是object dtype。

这样,pandas 将使用pandas DataFrame 对象表示表格数据。