宝妈育儿常识网 生活百科内容页

决定系数(R sup2 )

2025-04-24 16:40:28 生活百科

决定系数(R2R^{2} ),又称判定系数、拟合优度,是在线性回归分析中用于衡量回归模型对观测数据拟合程度的一个重要指标。以下为你详细介绍:

公式计算

对于简单线性回归模型,R2R^{2} 的计算公式为:R2=1i=1n(yiy^i)2i=1n(yiyˉ)2R^{2} = 1 - \frac{\sum_{i = 1}^{n}(y_{i} - \hat{y}_{i})^{2}}{\sum_{i = 1}^{n}(y_{i} - \bar{y})^{2}} 。其中 nn 是样本数量,yiy_{i} 是第 ii 个实际观测值,y^i\hat{y}_{i} 是第 ii 个通过回归模型预测的值, yˉ\bar{y} 是实际观测值的均值。

在多元线性回归中,公式形式不变,但计算过程涉及多个自变量,更为复杂。

取值范围及意义

取值范围R2R^{2} 的取值范围在 0 到 1 之间。

具体意义

R2=1R^{2}=1:表示回归模型能够完美拟合数据,所有观测点都恰好落在回归直线(或超平面,对于多元回归)上,即预测值与实际值完全相等,这在实际中很少出现。

R2=0R^{2}=0:意味着回归模型完全无法解释因变量的变化,预测值完全是随机的,等同于使用均值进行预测。

0<R2<10 < R^{2}< 1:越接近 1,说明回归模型对数据的拟合效果越好,即模型能够解释因变量的大部分变异;越接近 0,则拟合效果越差,模型对因变量变异的解释能力较弱。例如,若 R2=0.8R^{2} = 0.8,表示该回归模型可以解释因变量 80% 的变异。

 

局限性

虽然 R2R^{2} 是评估回归模型拟合优度的常用指标,但它存在一定局限性。比如,在多元线性回归中,增加自变量的数量通常会使 R2R^{2} 增大,即使新增的自变量实际上对因变量并没有真正的解释能力。因此,仅依靠 R2R^{2} 来评价模型优劣可能会导致过度拟合的模型被认为是好模型。为解决这一问题,人们提出了调整后的 R2R^{2} 等改进指标,对自变量数量进行修正,从而更准确地评估模型。

猜你喜欢