如何使用列表创建 Pandas DataFrame?

DataFrame 是一个二维的 Pandas 数据结构,它具有异构的表格数据,对应的labels(Rows and Columns).

在一般的pandas中,DataFrame用于处理CSV文件、SQL数据库、Excel文件等实时表格数据。如果要创建 DataFrame,有很多方法,例如:使用列表、Numpy 数组或字典。

我们可以使用一个简单的列表来创建一个 DataFrame。

示例

import pandas as pd # importing the pandas package

Li = [100,200,300,400, 500] # Assigning the value to list(Li)

df = pd.DataFrame(Li) # Creating the DataFrame

print(df) # Printing the values of DataFrame

解释

这里我们取一个5元素的简单列表作为Li,最初导入pandas包作为pd。通过使用 DataFrame Constructor,我们创建了一个表示为形状 (5X1) 的单列表。

输出结果

     0
0   100
1   200
2   300
3   400
4   500

在上面的输出中,有一列标记为 0,有 5 行标记为 0-4 个整数值,代表列表 (Li) 中的元素。

示例

# importing pandas packages
import pandas as pd

L = list('ABCDEFGH')

# creating pandas DataFrame object
df2 = pd.DataFrame(L, columns=['col1'])

print(df2)

解释

这个新的pandas DataFrame 对象是由python 列表创建的,包含所有字符串元素。为了实现这一目标,我们最初使用 list 函数创建了一个 python 列表对象“L”,然后我们创建了一个带有列表“L”的 Pandas DataFrame 对象。在创建 DataFrame 对象时,我们通过显式指定列参数提到了列名称“col1”。

输出结果

  col1
0   A
1   B
2   C
3   D
4   E
5   F
6   G
7   H
dtype: object

第一列中的整数值是 DataFrame 对象中行的索引值表示,第二列“col1”是具有位置索引值的字符串数据。