STATA教程:函数形式误设对OLS估计量的影响

需积分: 7 279 下载量 195 浏览量 更新于2024-08-10 收藏 2.22MB PDF 举报
"这篇资料主要讨论了在统计分析中,特别是使用STATA软件时,当第一假设不成立时,即模型设定错误时,对OLS(普通最小二乘法)估计量的影响。文中通过实例展示了如何在函数形式误设的情况下,进行模拟和分析,证明OLS估计量会变得有偏且不一致。同时,提到了STATA的基本使用方法,包括入门、命令语句、数据处理和函数等基础知识。" 在统计学和随机过程应用于电气工程的背景下,当进行回归分析时,我们通常依赖于一系列假设来确保估计量的性质。其中,"第一假设不成立"指的是模型的结构或函数形式与实际关系不符。在描述的案例中,作者通过STATA演示了如何在遗漏关键变量(如平方项)的情况下,OLS估计会出现偏差。 首先,案例中使用了STATA的`simulate`命令来生成模拟数据,其中包括随机变量x1、x2、x3、x4以及误差项u。然后,构建了一个线性模型,其中y是因变量,包含一个二次项x2^2,但回归时却忽略了这个二次项。通过运行`reg`命令进行OLS回归,然后使用`sum _b_z`计算估计量的平均值,结果显示OLS估计是有偏的,不一致的,这意味着模型的预测能力会受到影响。 为了进一步验证这一问题,`ovtest`命令被用来进行设定检验,该检验可以检查模型是否存在遗漏变量。在遗漏平方项的情况下,重新添加平方项到回归方程,再次运行`reg`命令,然后比较估计量,同样表明了有偏和不一致的问题。 此外,资料还简要介绍了STATA的基础知识,包括软件的入门步骤、基本命令的使用,如`use`命令用于打开数据,`varlist`定义变量列表,`ifexp`和`inrange`用于条件操作,以及`label`用于数据标签等。这些基础知识对于理解和操作STATA进行数据分析至关重要。 这篇资料强调了在进行统计分析时正确设定模型的重要性,并通过实例展示了模型设定错误如何导致OLS估计量的偏差。同时,它还提供了一个学习STATA基本操作的入门指南,涵盖了从安装软件到执行基本统计分析的一系列步骤。