DataFrame 是一个二维的 Pandas 数据结构,它具有异构的表格数据,对应的labels(Rows and Columns).
在一般的pandas中,DataFrame用于处理CSV文件、SQL数据库、Excel文件等实时表格数据。如果要创建 DataFrame,有很多方法,例如:使用列表、Numpy 数组或字典。
我们可以使用一个简单的列表来创建一个 DataFrame。
import pandas as pd # importing the pandas package Li = [100,200,300,400, 500] # Assigning the value to list(Li) df = pd.DataFrame(Li) # Creating the DataFrame print(df) # Printing the values of DataFrame
这里我们取一个5元素的简单列表作为Li,最初导入pandas包作为pd。通过使用 DataFrame Constructor,我们创建了一个表示为形状 (5X1) 的单列表。
输出结果
0 0 100 1 200 2 300 3 400 4 500
在上面的输出中,有一列标记为 0,有 5 行标记为 0-4 个整数值,代表列表 (Li) 中的元素。
# importing pandas packages import pandas as pd L = list('ABCDEFGH') # creating pandas DataFrame object df2 = pd.DataFrame(L, columns=['col1']) print(df2)
这个新的pandas DataFrame 对象是由python 列表创建的,包含所有字符串元素。为了实现这一目标,我们最初使用 list 函数创建了一个 python 列表对象“L”,然后我们创建了一个带有列表“L”的 Pandas DataFrame 对象。在创建 DataFrame 对象时,我们通过显式指定列参数提到了列名称“col1”。
输出结果
col1 0 A 1 B 2 C 3 D 4 E 5 F 6 G 7 H dtype: object
第一列中的整数值是 DataFrame 对象中行的索引值表示,第二列“col1”是具有位置索引值的字符串数据。