回归分析的基础概念之2:相关性与相关关系,相关系数与判定系数

发布时间:2025-04-25 14:23

大家好,欢迎来到许栩原创专栏《从入门到高手:线性回归分析详解》(本专栏总目录见上图),这是专栏的第二篇文章,确定关系与相关关系,相关系数与判定系数。

本专栏第一篇文章,我讲解了回归分析第一个基础概念,变量。这一章,将讲解回归分析另一个最重要的基础概念,相关性。

本章的主要内容如下。

1、什么是相关性?

2、函数关系、相关关系与因果关系。

3、相关系数及其计算方法。

4、相关关系强弱的评定标准。

5、判定系数及其计算方法。

6、相关系数与判定系数在回归分析中的作用。

一、什么是相关性?

在回归分析中,相关性是指变量与变量之间的相互影响程度或相互关联程度。

这个定义非常明了,不用我多做说明。我就强调一点:相关性是指变量之间相互的关联程度,是共变关系,即你变我也变,是互相影响互相关联的关系。当然,变的方向和变的程度可以不同。

相关性一般分为三种,即正相关、负相关和不相关。

1、当一个变量变化时,另一个变量和它相同方向变化,这两个变量就是正相关。也就是说,当一个变量增加时另一个变量也增加,当一个变量减少时另一个变量同时减少。比如当气温上升时,空调耗电量就增加,气温下降时,空调耗电量也会下降,气温和空调耗电量就是正相关。

2、负相关则相反,指的当一个变量增加时另一个变量减少,或一个变量减少时另一个变量增加。比如,当气温上升时,吃麻辣火锅的人就会减少,当气温下降时,吃麻辣火锅的人就会增加,气温和吃麻辣火锅的人数就是负相关。

3、不相关,顾名思义,就是指两个变量之间没有关系,即一个变量的变化对另一变量没有明显影响。

二、函数关系、相关关系与因果关系。

客观事物之间的关系,一般来说可以归纳为两大类,函数关系和相关关系(不相关也是相关关系的一种)。

函数关系,就是确定关系,是可以用精确的数学表达式表示的关系。确定关系的特征是,当自变量确定后,因变量为唯一值,也就是确定值。比如正方形面积的计算,S=a*b,当长与宽确定时,面积也是确定的,长宽和面积是确定关系。

相关关系,是一种非确定性的关系。两个变量之间有一定的关系,但当一个变量确定后,另一个变量并不是唯一的,另一个变量可以有若干种可能的取值。比如上文所讲到的,气温和空调耗电量之间,当气温变化时,我们无法用一个标准的数学表达式来计算空调耗电的数量,即空调耗电的数量是不确定的,气温与空调耗电量是相关关系。

因果关系是界于函数关系与相关关系之间的关系,因果关系,顾名思义,就是第一件事是第二件事的原因,而第二件事是第一件事的结果。比如因为缺料,造成订单无法交付,缺料与订单无法交付是因果关系,缺料是因,订单交付不了是果。

因果关系有一定的确定性,但不如函数关系完全确定。因果关系也不等同于相关关系,相关是偶然的,因果是必然的,相关是不确定的,因果是部分确定的。

很多理论将回归分析归于因果分析的一类,我并不认同。两个变量存在相关关系并不意味着一定具有因果关系,比如去年的气温与今年的气温有很强的相关性,但不能说今年气温变化的原因是因为去年的天气温度。

回归分析,主要分析的是相关关系。

三、相关系数及其计算方法。

相关系数,是衡量两个变量之间相关方向和相关程度的相对指标。相关方向,是指两者之间是正相关还是负相关。相关程度,是指两者之间相关的紧密度。

相关系数是一个统计指标,用字母R表示,最早由英国统计学家卡尔·皮尔逊设计并提出。

相关系数R取值在±1之间。当R为0时,表示两个变量绝对不相关。当R大于0时,两个变量正相关,即你增加我也增加,你减少我也减少。当R小于0时,两个变量负相关,即你增加我减少,你减少我增加。当R等于1或-1时,表示两个变量绝对相关。

相关系数的计算公式如下图。

这个公式是不是看起来特别复杂和繁琐?不是是看着头晕?或者直接说看不懂。

看不懂没关系,我也不准备讲解,因为,计算相关系数,我们有简单易学的算法。在各种计算工具越来越先进并且越来越简单的今天,我们对复杂的算法只需要有个脸熟就可以。

用Excel函数CORREL可轻松计算相关系数。

CORREL函数有两个参数,即两个变量的数组区域,详见下面两个图(CORREL函数介绍和CORREL函数实例)。

四、相关关系强弱的评定标准。

网址:回归分析的基础概念之2:相关性与相关关系,相关系数与判定系数 https://mxgxt.com/news/view/850988

相关内容

深入探索相关系数和相关性分析:皮尔逊与斯皮尔曼相关系数的解析与应用
如何理性分析直觉与判断的关系,科学与直觉
大规模网络结构数据分析与空间自回归模型|第1章 网络数据的定义及相关指标(2)
资源、资产与资本:概念解析及其相互关系
科学网—[转载]直系同源与基因家族相关的概念
若变量y与x之间的相关系数r=-0.9362,查表得到相关系数临界值r0.05=0.8013,则变量y与x之间( )
概念间关系之交叉关系、并列关系
数列与数的关系.doc
紫微斗数之144种命格解析,详细解读命宫与宫位关系
八卦与道家之间的关系,互相制衡

随便看看