多元线性回归模型:拟合优度与假设检验解析

需积分: 11 11 下载量 136 浏览量 更新于2024-07-11 收藏 1.36MB PPT 举报
"多元线性回归模型的拟合优度检验和假设检验是评估模型拟合效果的重要手段。可决系数(R²)和调整的可决系数(Adjusted R²)是衡量拟合优度的两个关键指标。可决系数R²表示模型解释的总方差比例,即因变量Y的总变异性中由自变量X解释的比例。它等于残差平方和(RSS)与总离差平方和(TSS)之比的负平方。调整的可决系数在R²的基础上考虑了自变量的数量,避免了在增加无关自变量时R²自动增大的问题。 在多元线性回归中,总离差平方和TSS是所有观察值与均值的离差平方和的总和,反映了因变量Y的全部变异性。残差平方和RSS是预测值与实际值的离差平方和,反映了模型未能解释的变异性。通过TSS减去RSS,我们可以得到解释平方和ESS,它表示模型对Y变异性所作的解释。 有趣的现象是,当模型完美拟合数据时,RSS将为0,此时R²等于1,意味着模型解释了所有变异性。然而,当模型过于复杂或存在过拟合时,即使RSS很小,但R²并不一定接近1,因为TSS可能也变得很小。这时,调整的可决系数Adjusted R²更能体现模型的真实解释能力,因为它会惩罚额外的自变量。 在假设检验方面,多元线性回归通常涉及参数的显著性检验,如t检验,以及整体模型的F检验。t检验用于检查每个自变量对因变量的影响是否显著,而F检验则检验所有自变量共同解释因变量变异性是否显著优于无自变量的模型。此外,还有残差分析,包括残差正态性检验(如QQ图和Shapiro-Wilk检验)、异方差性检验(如图示方法和Breusch-Pagan检验)以及多重共线性检验(如VIF值),这些都是确保模型假设成立和结果可靠的重要步骤。 在进行这些检验时,我们需要注意模型的线性关系、误差项的独立性、误差项的同方差性和误差项的正态分布等基本假设。如果这些假设不满足,可能会影响检验结果的解释和模型的可靠性。因此,在构建和评估多元线性回归模型时,除了关注拟合优度指标外,还需要全面检查模型的假设条件和残差特性。"