相关性是什么意思?

相关性是衡量两个定量变量(例如,身高、体重)内线性关系的功效的术语。根据变量的运动,主要有两种类型的相关性 -

  • 正相关——在两个变量的正相关中,两个变量都朝着相同的方向移动。这意味着当一个变量的值上升时,另一个变量也会增加,反之亦然。例如,您燃烧的燃料越多,您驾驶汽车的距离就越远。

  • 负相关- 在负相关的情况下,当一个变量增加时,另一个变量会下降,反之亦然。

强弱相关

在强相关中,可以根据另一个变量的值以相当高的准确度预测一个变量的值。在弱相关的情况下,一个变量的平均值与另一个相关,但也有很多例外。

样本相关系数“r”量化了关系的功效。还经常测试相关性的统计显着性。

相关分析的局限性

  • 除了正在探索的两个变量之外,相关性无法显示其他变量的存在或影响。

  • 相关性并没有告诉我们变异的原因和结果。

  • 相关性也无法描述曲线关系。

相关性描述一起移动的数据

相关性可用于描述数据集中的简单关系。例如,对于山地公园露营地的数据集,人们可能想知道露营地的高度与夏季平均温度之间是否存在关系。

在这里,对于每个单独的露营地,必须采取两项措施:海拔和温度。当您通过相关性检查样本中的这两个变量时,您会发现线性关系:随着海拔升高,温度下降。所以,这两个变量是负相关的。

相关数是什么意思?

相关性是通过无单位计算来衡量的,该计算称为相关系数,范围从 -1 到 +1,用“r”表示。统计部分用 p 值表示。因此,相关性通常用两个关键数字表示:“r =”和“p =”。

  • 接近“r”变为零,线性关系变弱。

  • 正“r”值显示正相关。

  • 负“r”值表示负相关。

  • p 值为我们提供了证据,证明我们可以证明总体相关系数不为零的事实,这取决于我们从样本中观察到的情况。

  • “无单位度量”表明相关性存在于它们自己的尺度上。在上面给出的示例中,为“r”给出的数字与高度或温度的比例不同。这与其他形式的统计数据不同。例如,高度测量的平均值与其变量在同一尺度上。