如何在Pandas Python中找到数据框中特定列的标准偏差?

标准差说明数据集中的值如何分布。他们还告诉数据集中的值与数据集中各列的算术平均值相差多远。

有时,可能需要获取本质上为数字的特定列的标准偏差。这是std()可以使用该功能的地方。可以将需要计算均值的列索引到数据框,并可以使用点运算符对此调用均值函数。

也可以传递列的索引以找到标准偏差。

让我们看一个相同的演示-

示例

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])}
print("数据框为:")
my_df = pd.DataFrame(my_data)print(my_df)print("The standard deviation of column 'Age' is :")
print(my_df['Age'].std())
print("The standard deviation of column 'value' is :")
print(my_df['value'].std())

输出结果

数据框为:
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The standard deviation of column 'Age' is :
31.499206339207976
The standard deviation of column 'value' is :
35.747101700697364

说明

  • 导入所需的库,并为其指定别名,以方便使用。

  • 创建由键和值组成的系列字典,其中值实际上是系列数据结构。

  • 该字典随后作为参数传递给存在于“ pandas”库中的“ Dataframe”函数

  • 数据框被打印在控制台上。

  • 我们正在研究计算其中包含数值的特定列的标准偏差。

  • 通过使用点运算符指定列的名称,在数据帧上调用“ std”函数。

  • 数字列的标准偏差打印在控制台上。

猜你喜欢