相关系数r与R方的关系 相关系数表

相关系数是统计学家卡尔·皮尔逊设计的第一个统计指标 , 是研究变量之间线性相关性的一个量 。由于研究对象的不同 , 相关系数的定义有很多种 , 皮尔逊相关系数是最常用的一种 。
相关表和相关图可以反映两个变量之间的关系及其相关方向 , 但不能确切表示两个变量之间的相关程度 。相关系数是用来反映变量之间相关程度的统计指标 。相关系数采用积差法计算 , 同样基于两个变量的离差及其各自的平均值 , 通过两个离差值相乘反映两个变量之间的相关程度;关注线性单相关系数 。
需要注意的是 , 皮尔逊相关系数不是唯一的相关系数 , 而是最常见的相关系数 , 以下的解释都是针对皮尔逊相关系数的 。
先看相关系数是怎么推导出来的 。我们知道 , 两个独立随机变量之和的方差可以推导如下:
这导致了协方差和相关系数的定义:
图1
从图1可以看出 , 当x和y相互独立时 , 它们的协方差为0 , 所以它们的相关系数也为0 。当两者线性相关时 , 即图2中的各种情况下 , 即Y=kX+b时 , 可将其代入图1中的相关系数计算 , 结果为1和-1 。
图二
从图1和图2可以得出 , 当两个随机变量相互独立时 , 它们的相关系数为0;当它们线性相关时 , 相关系数为1或-1 。以上是相关系数的三种极端情况 , 那么如何理解-1和1之间的相关系数的含义呢?
图3
图3中Y=2X , 属于完全正线性相关 , 相关系数自然等于1 。然后我们改变一些数字:
图4
相关系数变为0.91 。不断改变数字:
图5
相关系数变成了负值 。由此可以看出相关系数的意义 。其数值范围可以从最大的正线性相关1逐渐变化到负线性相关-1 。为什么会这样?让我们看看图1中相关系数的定义 。它的分子是
E{(X-E(X))(Y-E(Y)} , 看图3 , 其中X和Y的平均值分别为6和12 , (X-E(X))和(Y-E(Y))均为正或负 , 所以图3的相关系数最终由6个正数相加而成 ,  。在图4中 , 当x = 4 , y = 14时 , (X-E(X))和(Y-E(Y))是相反的 , 所以相关系数的最终结果是负的和负的 , 数值减小 。第五张图是相关系数中{(X-E(X))(Y-E(Y)}的六个乘积的结果 , 其中负数之和大于正数 , 所以相关系数的最终结果值为负 。
我们还应该注意到 , 相关系数定义中的分母总是正的 。
一般来说 , 相关系数是用来衡量一对数组中两个对应点围绕各自平均值方向一致性的增减 。
【相关系数r与R方的关系 相关系数表】相关系数的概念非常重要 , 它引出了信号分析中的相关函数、自相关函数和互相关函数 , 也引出了随机过程中自相关遍历性的概念 。因此 , 准确把握相关系数的含义有助于进一步的研究 。

    推荐阅读