OLS估计偏差:遗漏变量与共线性的实例解析

需积分: 44 30 下载量 24 浏览量 更新于2024-08-07 收藏 2.41MB PDF 举报
本资源主要探讨了在使用统计软件STATA进行数据分析时,当某些基本假设不成立的情况。主要内容分为三个部分: 1. 遗漏变量假设不成立: 当零条件误差假设不成立,即存在遗漏变量时,OLS(最小二乘法)估计量可能会产生偏差。第一段举例说明了当解释变量中遗漏了一个与被解释变量相关的变量(如能力x1)时,OLS估计量会表现出有偏性。通过模拟重复实验(`simulate`命令),我们可以观察到OLS估计量的偏斜,并通过`sum`命令展示结果。 2. 完全共线性假设不成立: 完全共线性意味着模型中的某些变量彼此完全依赖,这会导致某些系数无法估计。在提供的代码中,通过创建一个与原变量高度相关的合成变量(x5 = 3x2 + x1),STATA在构建回归模型时会自动移除一个变量来避免这种问题。 3. 条件同方差假设不成立: 未提及具体内容,但暗示了当存在序列相关(时间序列中的自相关)或异方差(因变量方差与解释变量有关)时,OLS的稳健性和有效性也会受到影响。这部分内容通常涉及对这类情况的诊断和处理方法,如广义线性模型(GLM)或加权最小二乘等。 在整个教程中,除了以上假设的检验,还涵盖了STATA的基本操作,如数据导入、显示、整理、函数和运算符使用、编程以及流程控制等。学习者可以通过实际操作和案例研究来加深理解如何在实际工作中处理这些假设问题,以确保数据分析的准确性和可靠性。