通过使用数据上的不同功能,可以获得有关数据的大量信息。但是,如果我们希望获得有关数据的所有信息,则可以使用“描述”功能。
此函数将提供诸如“计数”,“平均值”,“标准偏差”,第25个百分点,第50个百分点和第75个百分点之类的信息。
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']), 'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20]) } print("数据框为:") my_df = pd.DataFrame(my_data)print(my_df)print("数据描述为:") print(my_df.describe())
输出结果
数据框为: Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 数据描述为: Age value count 5.000000 5.000000 mean 47.200000 46.554000 std 31.499206 35.747102 min 12.000000 8.790000 25% 23.000000 23.240000 50% 45.000000 31.980000 75% 67.000000 78.560000 max 89.000000 90.200000
导入所需的库,并为其指定别名,以方便使用。
创建由键和值组成的系列字典,其中值实际上是系列数据结构。
该字典随后作为参数传递给存在于“ pandas”库中的“ Dataframe”函数
数据框被打印在控制台上。
我们正在寻找有关数据的所有信息。
在数据帧上调用“describe”函数。
描述打印在控制台上。