如何在Pandas Python中汇总数据?

通过使用数据上的不同功能,可以获得有关数据的大量信息。但是,如果我们希望获得有关数据的所有信息,则可以使用“描述”功能。

此函数将提供诸如“计数”,“平均值”,“标准偏差”,第25个百分点,第50个百分点和第75个百分点之类的信息。

示例

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])
}
print("数据框为:")
my_df = pd.DataFrame(my_data)print(my_df)print("数据描述为:")
print(my_df.describe())

输出结果

数据框为:
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
数据描述为:
          Age     value
count  5.000000  5.000000
mean  47.200000  46.554000
std   31.499206  35.747102
min   12.000000  8.790000
25%   23.000000  23.240000
50%   45.000000  31.980000
75%   67.000000  78.560000
max   89.000000  90.200000

说明

  • 导入所需的库,并为其指定别名,以方便使用。

  • 创建由键和值组成的系列字典,其中值实际上是系列数据结构。

  • 该字典随后作为参数传递给存在于“ pandas”库中的“ Dataframe”函数

  • 数据框被打印在控制台上。

  • 我们正在寻找有关数据的所有信息。

  • 在数据帧上调用“describe”函数。

  • 描述打印在控制台上。

猜你喜欢