有时,可能需要获取本质上为数字的特定列的平均值。这是可以使用“均值”功能的地方。
可以将需要计算均值的列索引到数据框,并可以使用点运算符对此调用均值函数。
也可以传递列的索引以找到均值。该术语mean()
是指找到所有值的总和,然后除以数据集中值的总数。
让我们看一个相同的演示-
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])} print("数据框为:") my_df = pd.DataFrame(my_data)print(my_df) print("The mean of column 'Age' is :") print(my_df['Age'].mean()) print("The mean of column 'value' is :") print(my_df['value'].mean())
输出结果
数据框为: Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The mean of column 'Age' is : 47.2 The mean of column 'value' is : 46.553999999999995
导入所需的库,并为其指定别名,以方便使用。
创建由键和值组成的系列字典,其中值实际上是系列数据结构。
该字典随后作为参数传递给存在于“ pandas”库中的“ Dataframe”函数
数据框被打印在控制台上。
我们正在研究计算其中包含数值的特定列的平均值。
通过使用点运算符指定列的名称,可以在数据帧上调用“平均值”函数。
数字列的平均值打印在控制台上。