pandas 数据框的各种摘要统计信息。

示例

import pandas as pd
df = pd.DataFrame(np.random.randn(5, 5), columns=list('ABCDE'))

生成各种汇总统计信息。对于数值,非NA /零值的数量(count),平均值(mean),标准差std和称为五位数摘要的值:

  • min:最小值(最小观测值)

  • 25%:下四分位或第一四分位(Q1)

  • 50%:中位数(中间值,第二季度)

  • 75%:上四分位或第三四分位(Q3)

  • max:最大值(最大观察值)

>>> df.describe()
              A         B         C         D         E
count  5.000000  5.000000  5.000000  5.000000  5.000000
mean  -0.456917 -0.278666  0.334173  0.863089  0.211153
std    0.925617  1.091155  1.024567  1.238668  1.495219
min   -1.494346 -2.031457 -0.336471 -0.821447 -2.106488
25%   -1.143098 -0.407362 -0.246228 -0.087088 -0.082451
50%   -0.536503 -0.163950 -0.004099  1.509749  0.313918
75%    0.092630  0.381407  0.120137  1.822794  1.060268
max    0.796729  0.828034  2.137527  1.891436  1.870520