1、Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 1 Chapter2 条件期望及现代观点下计量经济的 基本理念和理论基础 1 问题的提出 1、从数据谈起 模型、数据哪个是第一位的?传统观点是模型第一位,现代观点认为数据 是第一位的,我们不应当假设数据满足模型的条件,而应当要求模型适应数据 的特点,这是现代观点下计量经济的出发点。 a、 如果手头有一些数据, ,它能告诉你什么?什么也没有!因为12x 我们不知道数据来源背景,从而不知道数据所表达的含义。 b、 如果该数据是某人历次考试成绩的记录,它能告诉你什么?可以认 为,X 是某人的学习能力,称为总体(population)
2、 , 是学习能力的反映,12x 它是取自总体 X 中的样本,可建立模型: ,a 是真值,是客观存在的能X=+ 力,但不可观测。于是, 就反映了该学生的学习能力水平,i1xN 就反映了该生学习能力的稳定性。还可以用2i1var()()N 来预测考试的成绩,等等。x( ) c、但是,如果该数据是某企业的股票价格,那么就没有理由认为 是相互独立的,而是一个与时间有关联的序列,那么 就有12 xvarX和 ( ) 可能不再有一个稳定的极限,例如,随机游走。 。则, ,从而 显2101,(0,)ttttitxxN:2var(),tXttx 得不可预测,这样的数据可以认为是没有用的,但在现在的随机过程理论
3、和计 算机技术下,我们仍能从 中捕捉到“股票价值”X 的某些信息。t 这里,我们看到,经济中数据的来源是非常复杂的,有的可以看成是服从 某一分布的随机变量,有的则是某一特定的随机过程,甚至是不平稳过程。 d、对于有相互关联的多组数据, ,同样我1Nk1N1N,yxx和 们首先要知道数据的来源,知道有关 的知识,这一点与传统观点XY和 是一致的,但传统观点的局限是,解释变量 是确定性的,与误差项1k 无关。而这种要求的数据一般只在实验室中才能做到,大量经济数据一般事 前无法安排,并且解释变量之间也存在关联性,解释变量与误差项之间也有关 联性,另外,数据是不可重复的。为此,现实经济要求我们把对数据
4、的要求放 Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 2 宽。 假设:(1)我们关注的结果 Y 是一个随机变量(视为一个总体) 。 (2)我们认为影响结果 Y 的原因是一个 K 维随机变量, 。1K()X (3) 的联合分布存在,且存在期望和方差。(,YX (4)可以从 随机抽取观测样本(random sampling) 。,) 注: (1) 的联合分布、期望、方差存在,并不意味着已知。(,)Y (2) 的因果关系中,X 的分量 对 Y 的影响既有轻重之分,又有可观测与 iX 和不可观测之分,甚至有半不可观测,即 Y 与 X 的因果关系可以更加随意的设 定。 例如,我们
5、关注的是工资与教育的关系,但是影响工资的因素除了教育之 外,根据劳动经济学的知识,还有工作经验和能力。其中,工作经验可用工作 年限表示,又由于工作经验有正外部性,故可设计工作经验的平方作为另一个 解释变量,而能力则是不可观测,如 chapter1 的例 1,虽仍可以放在因果关系 中,但需要有特殊的处理。 (3)因果关系不一定是线性关系,从平均意义或期望意义上讲,我们要关注 的是条件期望, 含义是如果知道 X,平均意义上看 Y 是什么?它包含(|)EYX 有比从全体平均意义上看 Y 是什么即 更多的信息。并且希望能把E 表达出来,建立一个模型,称为总体模型(population model) 。
6、(|)EYX (4)随机抽取样本的最基本形式是截面数据(cross section data) ,含义是给 定一个固定的时间点或是时间段上,解释变量与因变量的数据是从母体中随机 发生的,而是实验数据(experimental data)的含义是实验者预先设定解释变量 的实验值,然后观测因变量的结果值,传统观点下的样本设定为实验数据, 是与实验数据无关的一切其他环境对结果的随机影响,数据与误差是分开的。 (5)随即样本的另外几种形式 Pooled cross section data 在不同时间点样本独立,但不同分布(混同样本) 。 Spatial correlation 在不同地区样本有相关性
7、,不独立(空间相关性) 。 Cluster sample 串样本,时间数据有分段特征(群集数据) 。 Panel data 面板数据,数据有二元特征,特别是有时间特征,但时间不太 长,有限。这些特殊样本的处理,我们在后面的模型中再联系模型进行分析、 介绍。 2 有关理论 Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 3 现在提出的问题是,如果现实的数据来源是一类随机样本,假设 是客观存在,但是未知或者部分未知,那么获取数据资料()YgX ,就应当反映这种客观存在的关系,111)()nkknnxxy, , ,进一步,如果 的函数关系不清楚,找一个什么(),ii ()YgX
8、样的函数关系是合理的?合理性的准确含义是什么? 下面着手建立解决上述问题的一套基本理论,着手解决两个问题: 1、合理性按均方误差标准,X 的什么关系 g (X)来表达 Y 是最优的,即: ,记成 MSE(mean square error)。2()()gMinEY 2、如果用线性关系 ,具备什么条件才能满足 1、的YX来 表 达 ,即 与 等价。*()X2()()gin2()MinEX 定理 1:用条件期望 来表达 Y,则 MSE 最小,即:|E , arg 表示满足最小值条件的 g(X)。2*()(|)ar()()gXEYiYg 首先复习一下条件期望的概念及性质。 随机变量(X,Y)有联合分
9、布 F(x,y)和联合分布密度 f(x,y) ,不妨设 f(x, y) 0。则:X 的边际分布密度()(,)xYfXfd Y 的边际分布密度 (),yXfYyd 给定 X 的条件下,Y 的条件分布密度 | (,)(,)()YXXYfxyfxyf d: 给定 X 的条件下,Y 的条件数学期望: (,)(|)()XYfEygx:,)()(|)()(,(),() XXYXYXY fxyEgdfxfxydyfydE Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 4 性质 1: ,直观含义是分段平均再平均等于直接平均。(|)(EYX 又由定义, ,做变量代换,()(,)| (XGX
10、fxggdx ,则:()ygx(,)|XYfxydEY 性质 2: ,见书上 2.19 式。(|)(|)E 的直观含义更明显,当 X=x 给定,它是常数的期望值()|g 等于常数的推广。 证明:设: 0 200200()|),()()(2()XEYMSgXgY那 么 00 0 02200)()|()(|)()()EgXgXYggMSEgXEXX注 意 到 ,取 , 则 最 小 ,证 毕 ! 注:这个定理很重要,它奠定了条件期望在均方误标准下的最优地位,问 题是当 Y 与 X 的联合分布很复杂,E(Y|X)实质上仍然是不清楚的。 例:随机参数过程 设 ,其中 与 X 独立,且 ,则,012()2
11、()0,var()E01201201(|) |)|(|X=EYE因 为 与 独 立 , 所 以 Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 5 2201201222var(|)(|)|)|()|(1)(|)YXEYXXE 注:我们也可以将模型看成, ,但是 ,于是01YX1()X u 就与 X 相关,从而 E(X | u) 0, 也与 X 相关,大量的计量经济模型var(|)u 都是由于环境既影响结果又影响原因,从而内生性往往是不可避免的,传统观 点假定 X 与 u 无关的要求不符合实际。 一般情况下,E(Y|X)很复杂,甚至是未知的,所以,尽管我们知道 E(Y|X)
12、在均方误标准下表达 Y 是最优的,但是我们需要一种方法,用其他的合理方式 来取代 E(Y|X),取代的方式取决于不同的目的,这就是问题(2) 。 如果目的是预测、是趋势、可采用非参数估计方法,这超出本书的范围, 请参阅相关非参数估计的书。如果目的是政策评价,验证理论是否正确,一般 采用参数估计方法,参数估计方法就是线性投影。 设 是影响 Y 的一切原因集, 是一个 k+1 维的参数空间, ,是012 iR 未知的。 是取自 X 中的 k+1 维向量,并且线性无关,例如1(,)kX2 2与 线 性 无 关 , 但 ln和 l线 性 相 关 。 定义: 01 (),kkAgXRF 注:我们只要求
13、g(X)关于 是线性的,对 X 不做任何要求,A 的直观含义 是从母体 X 中提取部分 外加常数构成 k+1 维向量 X,把 X 与 做内1l 积,构成 的线性函数集 A,于是我们可以把求 的问题转化为求未知(|)EY 参数向量 的问题,即: 122()min()min()kgXAREYEYX Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 6 当然,A 中的函数要比 F 中的少,A 包含于 F,但是限制在 A 中,却使问 题变得可以求解了。 定理:若 且 E(XX)存在、非奇异,那么 A 中的最小二乘解2()EY 。*1(),()gXXY 证明:由一阶条件得: 22020
14、()(),),2(kikiddEYEXYX )(0EY 由 E(XX)非奇异,E(XY) (施瓦茨不等式)2()EXY 故 E(XY) ,所以 *1 注:一般 ,下面考虑设定(specification)()(|)gX1,kYuR 称为 Y 的(关于 线性)模型,其中 u 为回归误差。 定理:设 则当且仅当垂直条件 成立,有 成立。,X()0EX* 证明:必要性:如果 ,那么由 ,*Y*1()()0EuYXEXY 充分性: 1*,0()uEYX如 果 那 么 注:1)特别取 Eu Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 7 2)这里没有考虑 ,仅是说明当 Y 写成
15、的线性投影形式时,当(|)EYX 时,u 要满足的条件,它比 =0 要弱。*(|) 下面要解决的问题是,把 Y 写成 与把 Y 写成 在什gX,Xu 么条件下是一致的,这个条件也就是现代观点下的多元现行回归模型的前提假 定。 定义:线性回归模型 称为正确设定的(correct model ,u specification)如果存在某一 ,使得从母体 中有01kR 否则,如果对所有的 ,则称线性回0(|)EYX成 立 , 1,(|)kEYX 归模型不是正确设定的。 定理 4:线性模型 是正确设定的,那么:,YXu 1)存在某一 ,使得00(|)0EX且 2) ()EX 3) *0 证明:由定义,
16、 由定理 1 的性质知, (1)成立0(|),YX(|)0EX 在由定理 3, (2) (3)成立。 注:1)由 ,故当模型是正确设定时,参数 的经济含义是0(|)E 0 边际效果, ( ,i=1 ,2,) ,否则 的含义是误导的。iiYX 2) ,()0,u若 且 不 是 正 确 设 定 的 , 则 意 味 着 :E(|)=+|即 E(u|X) 此时,若采用最小二乘法估计参数,会产生有偏、不一致的后果。 注:上述推导,X 和 Y 都是总体,没有抽样。等式是严格成立的。模型 是关于随机变量 Y 与 X 关系的认识。,Yu 3 渐进理论基础 现代回归模型的估计和检验由于样本 N 不再固定,更注重
17、一致性,基本原 则是保证一致性成立,现代回归模型的估计和检验由于样本 N 不固定,更注重 一致性。基本原则是,保证一致性成立,降低有偏性,提高有效性,从而,样 Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 8 本的极限理论具有基本的重要性。 1、收敛性的亥年概念: a) 序列 收敛,记为nana b) 随机变量序列 依概率收敛,xpnx c) 随机变量序列 分布收敛,nd d) 连续映照定理(Slutskys Thoery) 2、随会样本的极限定理 定理 1 : 是一列独立同分布 G 维随机向量序列,且:1,2iw ,g=1,G ,那么 ,其中 ,称为向量(|)igEw1
18、Npiwu ()wiE 序列的弱大数定律。 定理 2: 是一列独立同分布 G 维随机向量序列,且:1,2i ,g=1,G , ,那么(|)igEw ()0iE ,是一半正定矩阵。称为向量1(0,)var()Ndi iiBwE , 其 中 序列的中心极限定理。 定义 1:(一致性) 是一个 P1 维的样本函数的序列,:1,2N N 是样本容量,如果 ,对任意的 成立,则称 的一致估p NN是 计,其中 是未知参数空间的定义域。 定义 2: 是一个 P1 维的样本函数的序列,如果:1,2N ,其中 V 是半正定阵,则称 是 渐进正态的,且()(0)dN N V 是渐进方差,记作 。因此, ,故也称
19、var()NA(,)Vormal: 的渐进方差为 ,记成NV/ 一般而言, V 未知,我们有许多关于 V 的一致估计 ,因此 的渐进方NN 差估计就是 ,记成 。/Nvar()/NA 注:因为 0, (N) ,所以 0,故当 N 充分大, 无意/NV 义。我们说 是 的渐进方差估计,意义是 的渐进方差估计是/NV () Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 9 ,而不是 0,这一点很重要。NV/N 定义 3:如果 ,V 正定,且主对角线元素用()N(0,)dormal 表示,又有 , ,那么 的第 j 个分量 的渐进标准差记为j pV NNj 。()Njse1/2
20、j规 定 为 ( ) 定义 4: 和 是 的 一致估计,即 ,N 1/2Npo ,且 , ,如果 D-V1/2Npo var()NVAvar()NDA 是正半定矩阵,则称 比 是渐进有效的。又 ,则称 和N 1pN 是 等价的。N 定义 5 :如果 ,若 ,且相应的()(0,)dNormalV 12,0 ,有 有渐进方差 , 有渐进方差 ,则称12 N1()12()N2V 估计 和 是渐进独立的。1N2 关于统计检验的渐进理论: 定义 6:对假设检验 H0,如果它的备择假设 H1 为真,且 ,则称检验是渐进一致的。01lim(|)NP拒 绝 引理:线性变换下的渐进正态性:如果 ,V()N(0,
21、)dormal 正定,又 R 是 QP 矩阵, Q P,秩(R)=Q ,则:()NR ,又二次型(0,)dNormalV 1()()NV ,此外如果有 ,那么 Wald 统计量即二次型:2Q liNpV1 1 2 ()()()()()dNN NNQRRR 注:此引理可推广到非线性,利用 Wald 统计量,我们可以解决有线性约束的 检验问题。 H0 : ,H 1 : (为保持与书中符号一致性, R 相当经典模型rr 中的 C,r 相当于 q) 。 又当有约束条件下的参数估计易证,如部分系数为零,那么采取拉格朗日 Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 10 乘数检验更
22、为方便,特别在异方差假定下,可以取代 F 检验。 本章小结 1、现代观点:数据本位,模型要适应数据的要求。 2、现代观点基本理念: (1)关注的目标 Y 是一个随机变量,它与影响它的因素 X,X 是一个多 维随机向量,存在联合分布,且 X 中某些因素不一定可观测, X 和 Y 的期望和 方差均存在、有限,并且可以随机抽样。 (2)用 X 表达 Y,Y=g(X),在均方误差最小(MSE)的意义下,g*(X) =E(Y|X)是最优的,且令 Y=E(Y|X)+U,则 E(U|X)=0。 (3)线性投影(参数估计方法) ,在 X 中抽取 l 个变量, (lk) ,把 Y 投影 到 k+1 维向量 Rk
23、+1 上, ,用 的线性函数 表达1k01kX Y,即令 ,当 E(XX)非奇异,且 EY2 ,则最 011,kkXu 小二乘估计 *, ,在 MSE 意义下是最优的,且 E(Xu)1()()EY =0, (4)定义模型是设定的,如果存在 ,使得 E(Y|X)=X 0 ,于是01kR 可知 ,E(Xu)=0,反之模型不是正确设定的,则 E(Xu)不等于 0,从而0* ,称模型存在内生性问题,即 X 与 U 相关。(|)EUX 要特别强调的是, “正确设定”只是一个强制性的假设,当 E(Y|X)本质上 是非线性的,如: ,则任何有限的线性12(|) kEYX 表达都不可能是正确设定的。又如,E(
24、Y|X)是分段的阶梯函数,用线性表达和 加入虚拟变量显然留下了更多人为的痕迹。非线性模型的参数估计,是下册书 的主要内容。也正是有了各种条件期望的概念,线性模型和非线性模型才统一 起来了,无非是用 X 的不同函数形式来表达 E(Y|X)。 (5)样本多样性 1)截面数据 cross section data iid 2)面板数据 panel data 二元特征 3)混合数据 pooled data 独立但不同分布 4)时间序列数据 time series Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础 11 5)空间相关数据 6)串数据 (6)样本统计分布是检验的基础 3、定理与统计量 (1)3 个定理和 渐进正态性,N 向量序列的弱大数定律(WLL) 向量序列的中心极限定理(CLL) 随机变量(向量)序列趋于常量的连续映照定理(Slutskys Theory ) 渐进正态性 (2)2 个基本统计量: Wald 统计量 1 1 2()()()()()dNNNNNQVRVRR LM 统计量 1 1()()()()()()k kk kkkLLMCovCovC 2dr