没有合适的资源?快使用搜索试试~ 我知道了~
首页计量经济模型与经济预测(第4版).pdf
《计量经济模型与经济预测》(第4版)分为4部分,每一部分主要讨论一种类型的模型。第1部分和第2部分讨论的是最基本的模型,即单方程回归模型。为建造单方程回归模型而发展出来的计量经济方法,以及这些方法的变化形式,将被用于多方程模型以及时间序列模型的建造。第3部分多方程模型的讨论十分重要。第3部分的每1章是关于联立方程模型估计方法的讨论,包括模型的确认问题以及诸如两阶段和三阶段最小二乘估方法。第4部分专门用来讨论时间序列模型。
资源详情
资源评论
资源推荐

下载
即使从最应用性的角度,经济计量学的学习也要求对统计学有较好的了解。我们假设大多
数读者学过统计学,但我们知道这些知识需要更新。在继续学习计量经济学之前,我们将复习
统计学的观点,这些知识将在以后的各阶段中发挥它们的作用。为帮助读者把注意力放在重要
的观点而不是细节上,我们把大部分推导放在附录 2 - 1 中。
2.1 随机变量
随机变量是变量,它可以取不同的值,并且取每一个值的概率小于等于 1。我们可以通过
研究随机变量生成各个取值的过程来描述一个随机变量,这个过程称做概率分布。概率分布列
出所有可能出现的结果及每个结果发生的概率。我们可以将随机变量定义为一个函数,这个函
数为每一个试验结果赋予一个实数值。例如,假设抛硬币出现正面的取值为 1,反面的取值为
0 ( 如果硬币是均匀的,出现正面的概率将为 1 / 2 ) 。此例中我们可以把抛硬币的取值看作一个随
机变量;生成这个随机变量的过程是二项概率分布。
弄清离散型随机变量和连续型随机变量之间的区别是很有用的。一个连续型随机变量可以
取实数轴上的任何值,而一个离散型随机变量只能取若干特定的实数值。图 2 - 1 表示的是离散
型随机变量和连续型随机变量的概率函数。由图 2 - 1 中离散型随机变量的分布,我们看到取值
1 0 和2 0 发生的概率都是0 . 2 5,而取值4 0 发生的概率为0 . 5 0。在图2 - 1的连续型分布中,随机变量
的取值位于某两个值之间的概率是由这两个值之间连续密度函数之下的面积决定的。在此例中,
随机变量取值位于1 0和2 0 之间的概率约等于0 . 3,即图中的阴影部分。
图2-1 概率密度
第
2
章
■ 统计基础知识复习
a) 离散型 b) 连续型

下载
2.1.1 期望值
人们经常用均值和方差来描述概率分布,它们都是由期望算子 E定义的。因为我们将从离
散型随机变量开始讨论,因此设 X
1
、X
2
…X
N
代表随机变量X的N个可能结果,则X的均值或期望
值是所有可能结果的一个加权平均值,其中权重为各结果发生的概率。具体说来, X的均值(记
为µ
X
)定义为:
其中p
i
为X
i
发生的概率, ∑p
i
= 1 ,且E( )为期望算子。
期望值应与样本均值区分开来,后者表示样本的平均值,而样本是一组对某一概率分布进
行观测得到的观测值(观测值的选取一般是随机的 )。X的一组观测值的平均值记为 X
—
。
随机变量的方差是随机变量在其均值周围分散或离散程度的一个度量,记为 σ
2
X
。(在离散
型随机变量情况下),方差的定义为
因此方差是 X的取值与其期望值之差平方的加权平均,其中权重为相应取值发生的概率。式
( 2 - 2 )中的方差本身也是一个期望,这是因为
方差的(正)平方根称为标准差。
期望算子有很多有用的性质,特别在讨论随机变量的期望和方差时更为有用。我们建议读
者仔细阅读附录2 - 1 中的细节。以下是有关期望算子的三个主要的结论:
结论1
结论2
结论3
2.1.2 随机变量的联合分布
研究X和另一个随机变量 Y之间的联合分布是很有用处的。在离散情形下,联合分布可以
用一个概率分布表描述,这个分布表列出 X和Y所有可能结果出现的概率。例如,如果 Y是这样
的一个随机变量,即当户主受过大学教育时,取值为 1;否则取值为0;而X是前面描述过的家
庭收入变量,那么X和Y的联合分布如下:
结果 概率 结果 概率
X=$5000, Y= 1 0 X=$10 000, Y= 0 1 / 8
X=$5000, Y= 0 1 / 4 X=$15 000, Y= 1 1 / 3
X=$10 000, Y= 1 1 / 8 X=$15 000, Y= 0 1 / 6
注意:所有概率都是非负的,而且它们的和为 1。
与单个随机变量的情况一样,期望算子对于描述联合分布的重要性质也是很有用的。我们
将X和Y的协方差定义为X、Y与各自均值离差乘积的期望;
第2章 统计基础知识复习
13
(2-1)
(2-2)
(2-3)
(2-4)
其中X是随机变量,a、b是常数

其中p
i j
表示X与Y发生的联合概率。
协方差是X与Y之间线性相关关系的一个度量。如果两个变量总是同时大于或小于各自的
均值,则协方差为正,如图 2 - 2 b所示。如果Y小于其均值时X大于其均值,或者 Y大于其均值时
X小于其均值,则协方差为负,如图 2 - 2 a 所示。协方差的值依赖于 X和Y的度量单位。因此我们
经常用到相关系数
其中σ
X
和σ
Y
分别代表X和Y的标准差。
与协方差不同,相关系数经过了标准化,没有量纲。可以证明相关系数的值总在 - 1 到+ 1 之
间。一个正的相关系数表示变量的运动是同方向的,而负相关系数表示变量的运动是反方向的。
在处理联合概率分布时一些关于期望的性质是很有用的。我们把这些结果陈述如下,其证
明请见附录2 - 1。
结论4 如果X和Y是随机变量,E(X+Y) = E(X ) + E(Y )
结论5 Va r (X+ Y ) = Va r (X) + Va r (Y) + 2 C o v (X, Y )
图2-2 协方差
2.1.3 独立与相关
在某些情况下, Y结果发生的概率与 X结果发生的概率无关。在这种情况下,我们称 X和Y
14
第1部分 回归分析基础
下载
(2-5)
a) 协方差为负
b) 协方差为正
某小公司5个雇员的收入(单位:1000美元)和受教育年数的联合概率分布如下:
收入(X) 5 10 15 20 25
受教育年数(Y) 10 8 10 15 12
各变量的均值和方差为:
所以X和Y之间的协方差为:
最后,X和之间的相关系数为
例2.1 协方差和相关系数

是独立的随机变量。举个例子,如果抛硬币时正反两面发生的概率均为 1 / 2,假设前5次结果都
是正面,第6次发生反面的概率还是1 / 2,它与前面发生的结果无关。
当两个变量独立时,关于期望算子的计算就变得简单了。有关结论归纳在结论 6和7中,关
于它们的证明请见附录2 - 1 。
结论6 如果X和Y独立,E(X Y) =E( X) E(Y)。
结论7 如果X和Y独立,C o v (X ,Y) = 0。
结论7说明,如果两个随机变量是独立的,它们的协方差为 0。这个结论很直观,因为 X和
Y之间的独立意味着一个变量的结果与另一个变量的结果没有关系。这样的话, X与其均值之
间的离差和Y与其均值之间的离差也没有关系。然而,必须注意的是,这个结果不可逆,这一
点很重要。相关系数为 0的两个变量仍可能是不独立的。关键在于方差和相关系数度量的是线
性相关性;相关系数为0的变量间可能会具有非线性相关关系。
例如,设X和Y的概率分布如下:
X -2 -1 0 1 2
Y 4 1 0 1 4
设所有的结果以相等的概率 ( 1 / 5 ) 发生。在这个例子中,E(X) = 0,E(Y) = 2,并且
但是,随机变量X和Y显然不独立。实际上,所有的 5个联合分布的可能结果都符合 Y=X
2
的关系,
这是恰恰是X与Y间的非线性关系。
2.2 估计
2.2.1 均值、方差和协方差的估计
只有在获得所有可能的结果,即总体时,我们才能够确定均值、方差和协方差。但是通常
我们只有关于总体的一个样本,因此我们想要通过样本对总体的特征进行推断。我们将本章中
讲述如何取得N个样本数据,对总体特征进行估计,最后得到关于样本估计与相应的总体参数
之间关系的结论。由于无法获得均值、方差以及两个随机变量间协方差的真值,我们只能利用
样本信息来寻找尽可能好的估计。
我们的目标是要确定一个法则,它能对每个可能的样本给出样本估计值。为了区别具体的
估计值和普遍的估计法则,我们把后者称为估计量。对学生来说,混淆“估计值”和“估计量”
是很常见的现象,但是如果我们记住估计量是一个法则,而估计值只是一个数,这种混淆就不
会发生了。
寻找适用于任何样本的最优估计是一个复杂问题,我们将在 2 . 3 节更详尽地进行讨论。在
这里我们只假设最低的要求是参数的估计量所给出的估计值很接近于被估计的参数 (比如均值
或者方差)。更具体地说,我们希望估计量是无偏的,即估计量的期望值等于被估计参数。作
为一个例子,让我们来重新考虑均值为
x
的随机变量X的样本均值。估计量X
—
的定义为:
注意到下面一点十分重要,即X
—
是一个随机变量,虽然它所对应的总体参数是常数,它的取值
将随着样本的不同而不同。由于样本估计值随样本的不同而不同,我们就可以描述出它的概率
分布。重复抽取新的样本并每次分别计算样本均值和方差,我们可以得到这个抽样分布。均值
第2章 统计基础知识复习
15
下载
(2-6)

下载
的抽样分布可以度量样本均值落在区间中概率 (回忆前面概率分布中的讨论 )。
给定X
—
的抽样分布,我们很自然要问,估计量X
—
的期望值是否等于总体均值,换句话说,
X
—
是无偏估计量吗?为了说明X
—
是无偏的,我们证明E(X
—
) =
X
:
随机变量方差估计量的合理选择是:
问题是这个估计是有偏的。附录 2 - 1 的结论9给出了一个随机变量方差的无偏估计 (均值未知):
为什么我们要除以 N- 1 (而不是N)来获得样本方差的无偏估计呢?真正的答案请见附录 2 - 1结论9
的证明,但是也可以用自由度的概念直观地解释。已知我们的样本包含 N个数据,但在计算样
本方差时,第一步就需要计算样本均值,对 N个数据点来说就有了一个约束条件,即 N个观测
值之和等于N倍的X
—
。这样就剩下N- 1 个无约束的观测值估计样本方差。
最后,我们考虑如何求得两个随机变量之间协方差的一个无偏估计。因为协方差的定义是
因此协方差可用X,Y与各自均值的离差乘积的平均值来计算,即:
但是,与样本方差估计量的情况一样,这个估计是有偏的。为了得到协方差的无偏估计量,我
们用自由度除上面的和。在计算 X,Y与均值的离差乘积之和时,共有 N个X和Y的联合观测值,
即有N项独立的信息;其中一项信息用来计算 X和Y的样本均值:约束条件为 X和Y的N个观测值
之和分别等于N倍的X和Y的均值。因此自由度为 N- 1 ,则样本协方差的无偏估计为
样本协方差与协方差真值的区别是在符号 C o v上加了个帽子( ^ )。
最后,我们可以定义两个随机变量间的样本相关系数,它对应于我们前面定义过的总体相
关系数。样本相关系数是
为了将r
X Y
与其他有关相关性更复杂的度量相区别,我们称它为 X和Y之间的简单相关系数。与总
体相关系数相同,样本相关系数的值域为- 1到+ 1 ,因此它的平方在 0到1之间。我们可能会注
意到X和Y的简单相关系数与样本协方差的直接关系如下:
计量经济学研究变量间的相关关系。由于协方差告诉我们两个变量间是否相关及相关到什
16
第1部分 回归分析基础
(2-7)
(2-8)
(2-9)
剩余379页未读,继续阅读
















安全验证
文档复制为VIP权益,开通VIP直接复制

评论1