SPSS多元逐步回归:3种筛选方法详解与结果解读

需积分: 11 6 下载量 25 浏览量 更新于2024-08-05 收藏 280KB DOCX 举报
多元逐步回归是一种统计分析方法,用于在多元线性回归模型中逐步选择和排除自变量,以优化模型的预测能力和解释能力。本文档详细介绍了在SPSS中实施多元线性回归的三种筛选自变量的方法: 1. 向前法:这是一种逐次加入自变量的方法。SPSS从一个初始的空模型开始,每次添加一个与当前模型偏差平方和最大且具有统计学显著性的自变量。此方法可能包括一些非关键变量,但有助于识别最重要的影响因素。 2. 向后法:虽然这种方法通常不常用,它从包含所有自变量的模型开始,然后依次移除那些偏差平方和最小且无统计学意义的变量。这个过程相对复杂,可能会漏掉重要的关联。 3. 逐步法:结合了向前法和向后法的优点,它在每一步都重新评估已纳入的变量,决定它们是否应继续保留。这样可以确保模型的准确性,避免过度拟合。 在进行多元逐步回归后,结果判断的关键在于: - VIF值:如果VIF值大于10,意味着可能存在多重共线性,需要剔除相关性强的自变量,以提高模型的稳健性。 - 残差统计表:检查残差的正态性和独立性,以及库克距离(Cook值)来检测异常值或强影响点。在本例中,由于库克距离的最大值小于1,数据被认为适合进行回归分析。 模型构建过程中,文档展示了以下内容: - 模型纳入变量表:记录了纳入模型的4个变量(LTP、SOM、SAN和LTN4)以及它们对产量的影响,使用步进法进行变量选择。 - 模型摘要:显示了每个模型的R方、调整后R方等指标,反映了模型的拟合优度。在本案例中,随着变量增多,R方和调整后R方逐渐增大,显示出模型的有效性。 最后,ANOVA表用来检验模型的整体显著性,通过观察F值(如F值分别为118.207、106.346),确认模型各阶段的改进是否具有统计学意义。 总结来说,本文档提供了一套完整的多元逐步回归分析流程,包括自变量的选择策略、结果评估标准,以及关键统计表格的解读,对于实际数据分析具有指导价值。