中国居民消费支出分析:多元线性回归拟合与假设检验

需积分: 11 11 下载量 86 浏览量 更新于2024-07-11 收藏 1.36MB PPT 举报
"该文介绍了中国居民人均消费支出的多元线性回归模型的拟合优度检验和假设检验,通过F统计量比较了一元模型和二元模型的显著性,并探讨了可决系数和调整可决系数在评估模型拟合程度中的作用。" 在多元线性回归分析中,我们通常会构建模型来研究变量间的关系,例如中国居民的人均消费支出可能受到多个因素的影响。在这个例子中,我们有两个模型:一元模型和二元模型。一元模型仅包含一个自变量,而二元模型则包含两个自变量。模型的拟合优度是评估模型对数据解释能力的重要指标。 一元模型的F统计量为985.6616,对应的P值为P54,意味着在55个自由度下,这个模型的显著性水平非常高。二元模型的F统计量为560.5650,P值为P72,同样表明在73个自由度下,模型也是显著的。 在显著性水平α = 0.05下,我们需要比较F统计量与临界值。对于一元模型,临界值Fα(1,30)=4.17;对于二元模型,临界值为Fα(2,28)=3.34。由于实际计算得到的F值大于临界值,我们可以认为在一95%的置信水平下,一元模型和二元模型的线性关系都是显著的。 拟合优度通常由可决系数R²衡量,它表示模型解释因变量变异的百分比。可决系数R²越大,说明模型对数据的拟合度越好。此外,还有调整的可决系数R²调整,它是R²的修正版,考虑了自变量的数量,防止在过多自变量时过高的R²值导致的误导。公式为: \[ R_{\text{调整}}^2 = 1 - \frac{n-1}{n-p-1}(1-R^2) \] 其中,n是样本数量,p是自变量的数量,R²是普通可决系数。 在分析中,我们观察到TSS(总离差平方和)可以被分解为ESS(解释离差平方和)和RSS(残差平方和)。ESS反映了模型对数据的解释程度,而RSS则表示模型未能解释的部分。可决系数R²就是ESS与TSS的比值,而调整的可决系数则进一步考虑了自变量的数量,以提供一个不受自变量增加影响的度量。 这个例子展示了如何通过F检验和可决系数来评估多元线性回归模型的拟合优度和假设检验,这对于理解和预测中国居民人均消费支出的变化具有重要意义。在实际应用中,这样的分析可以帮助政策制定者或研究人员识别影响消费支出的关键因素,并据此制定相应策略。