数据框是一种二维数据结构,其中数据以表格格式存储,以行和列的形式。
它可以可视化为SQL数据表或excel工作表表示形式。可以使用以下构造函数创建它-
pd.Dataframe(data, index, columns, dtype, copy)
让我们了解如何使用Series字典创建数据框。
系列是“熊猫”库中存在的一维数据结构。
轴标签统称为索引。
系列结构可以存储任何类型的数据,例如整数,浮点数,字符串,python对象等。
让我们看一个例子-
import pandas as pd my_data = {'ab' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 'mn' : pd.Series([56, 78, 13, 13], index=['a', 'b', 'c', 'd'])} my_df = pd.DataFrame(my_data) print("从以下系列的字典创建的数据框: ") print(my_df)
输出结果
The dataframe created from dictionary f series : ab mn a 1.0 56 b 2.0 78 c 3.0 13 d NaN 13
导入所需的库,并为其指定别名,以方便使用。
创建由键和值组成的字典值,其中值实际上是序列数据结构。
该系列字典随后作为参数传递给存在于“ pandas”库中的“ Dataframe”函数
通过将系列字典作为参数传递给它来创建数据框。
数据框被打印在控制台上。
注意-“ NaN”一词指的是“不是数字”,这意味着特定的[row,col]值没有任何有效的条目。