DataFrame 用于以二维数据表格式表示数据。与数据表一样,pandas DataFrames 也有行和列,每一列和每一行都用标签表示。
通过使用python字典,我们可以创建我们自己的pandas DateFrame,这里字典的键将成为列标签,值将成为行数据。
这里我们将使用 python 字典创建一个 DataFrame,让我们看下面的例子。
# importing the pandas package import pandas as pd data = {"int's":[1, 2, 3, 4], "float's":[2.4, 6.67, 8.09, 4.3]} # creating DataFrame df = pd.DataFrame(data) # displaying resultant DataFrame print(df)
变量data有一个带有键值对的python字典对象,这里字典的键表示为列标签,字典的值表示为结果DataFrame中的行数据。
在给定的字典中,键具有字符串数据“int's, float's”,字典的值加载了列表整数和浮点值。
输出结果
int's float's 0 1 2.40 1 2 6.67 2 3 8.09 3 4 4.30
'df' DataFrame 对象输出显示在上面的块中,正如我们看到的列标签“int's, float's”来自字典键,DataFrame 中存在的值来自数据变量的字典值。
# importing the pandas package import pandas as pd data = {'B':'Black', 'W':'White', 'R':'Red', 'G':'Green'} # creating DataFrame df = pd.DataFrame(data, index=['Colors']) # displaying resultant DataFrame print(df)
在以下示例中,字典“data”只有标量值,因此我们需要明确提及索引标签。如果我们没有提到索引值,那么它会上升“ValueError”。默认情况下,字典中的键将成为列标签。
输出结果
B W R G Colors Black White Red Green
上面的 DataFrame 对象只有一行四列。