使用python pandas库有什么好处？

首先我们可以说它有各种工具来支持数据加载到数据中，objects(pandas DataFrame and Series)而不管它们的文件格式如何。这意味着我们可以使用任何 Pandas 输入函数读取任何文件格式的表格数据。一些 Pandas 输入函数的列表是 read_table、read_csv、read_html、read_excel、read_json、read_orc、read_sql 等等。

示例

df = pd.read_table('file.txt',sep=' ')
df

解释

在上面的例子中，我们有一个带有表格数据的文本文件，数据用空格分隔（每列之间）。在这里，我们使用这个 read_table 方法和关键字参数 sep 创建了一个 DataFrame。关键字参数 sep 的输入是空格（“”），因为此文本文件中的数据仅由空格分隔。

输出结果

   column1   column2
0        1         2
1        3         4
2        5         6

上面的输出是存储在 Pandas 数据对象（DataFrame 对象）df 中的数据，它是来自我们的文本文件“file.txt”的表格数据。

同样，我们在这个 Pandas 库中有各种可用的功能，例如

我们可以自定义索引 DataFrame 对象的表索引。
我们可以重塑 DataFrame 对象中的数据，以从数据表中获取更多信息。为了重塑 DataFrame，我们使用了许多方法，例如 pivot、melt 等。
我们可以使用 Pandas 数据对象面向标签的切片技术对数据进行切片。可以通过测距、loc 和 iloc 方法来完成。

示例

Series[:2]

解释

在上面的这个例子中，我们得到了一组切片的 Pandas Series 对象，这里我们通过使用切片范围到我们的 Pandas 数据对象（Series 对象）来做到这一点。

并且我们可以datasets(multiple DataFrame)高效地合并高性能。
它支持时间序列功能，以便我们可以处理与日期和时间相关的数据。
pandas 包包含多种方法，方便数据过滤操作。

同样，我们在这个 Pandas 包中有更多可用的功能来处理 Python 中的任何形式的数据。

基础教程