数据框是一种二维数据结构,其中数据以表格格式存储,以行和列的形式。
它可以可视化为SQL数据表或excel工作表表示形式。
可以使用以下构造函数创建它-
pd.Dataframe(data, index, columns, dtype, copy)
“数据”,“索引”,“列”,“ dtype”和“副本”不是必填值。
字典列表可以作为输入传递到数据框。默认情况下,字典键被用作列名。让我们看一个例子-
import pandas as pd my_data = [{'ab' : 34}, {'mn' : 56},{ 'gh' : 78}, {'wq' : 90},{'az' : 123},{'kl' : 45}] my_df = pd.DataFrame(my_data)print("从字典列表创建的数据框: ") print(my_df)
输出结果
从字典列表创建的数据框: ab az gh kl mn wq 0 34.0 NaN NaN NaN NaN NaN 1 NaN NaN NaN NaN 56.0 NaN 2 NaN NaN 78.0 NaN NaN NaN 3 NaN NaN NaN NaN NaN 90.0 4 NaN 123.0 NaN NaN NaN NaN 5 NaN NaN NaN 45.0 NaN NaN
导入所需的库,并为其指定别名,以方便使用。
创建字典值列表,其中在一个字典中存在一个键-值对。
这样,将创建多个词典并将其存储在列表中。
此字典列表稍后作为参数传递给存在于“ pandas”库中的“ Dataframe”函数
通过将字典值列表作为参数传递来创建数据框。
数据框被打印在控制台上。
注意-“ NaN”一词指的是“不是数字”,这意味着特定的[row,col]值没有任何有效的条目。