1、关于我国私人汽车拥有量的计量经济学模型及其检验和预测摘要 建立准确而合理的计量经济学模型,寻求全国私人汽车拥有量和社会经济的相关指标之间的函数关系,可以较为准确的对一国短期内私人汽车拥有量的变化进行定量的分析与预测。本文采用19892005年中华人民共和国国家统计局公布的相关统计数据,给出建立计量经济学模型和对其进行多种检验的详细过程,并根据模型预测了2006年我国的私人汽车拥有量。关键词 私人汽车拥有量 计量经济学模型 检验 预测0 前 言预测是指以准确的调查统计资料和市场经济信息为依据,从现象的历史、现状和规律出发,运用科学的方法,对未来发展前景的测定。预测是决策科学化的工具,是编制计划、
2、预见计划执行情况、加强计划指导的依据,也是企业改善管理的有效手段之一。预测方法可以分为定性预测和定量预测。定性经济预测是指,通过调查研究,了解实际情况,凭自己的实践经验和理论、业务水平,对发展前景的性质、方向和程度做出判断进行预测的方法。定量经济预测是指,根据准确、及时、系统、全面的调查统计资料和市场经济信息,运用统计方法和数学模型,对未来发展的规模、水平、速度和比例关系的测定。定量预测包括时间序列预测和回归分析预测等。实际工作中,为了保证预测结果的可信度,定性预测和定量预测往往结合起来使用。改革开放以来,我国创造了经济高速增长的神话,拥有近13亿庞大人口的基数,在2003年实现了人均GDP1
3、000美元的基本小康目标,这也是私家车开始步入普及化道路的里程碑。从近几年如火如荼的汽车市场发展来看,即使最近出现了不同程度的车市渐冷现象,但无论是国外跨国公司,还是国内汽车业霸主和中小汽车厂商,仍然纷纷投资于新车开发、产品推广与宣传,其持久看好中国车市的坚定信心没有丝毫动摇。现实生活中,汽车进入普通家庭已成为一个人所共知的事实,同样也会成为社会经济发展的必然趋势。鉴于此原因,我们进行了这次关于私人汽车拥有量的计量模型研究,预测了2006年我国的私人汽车拥有量。l 检验方法1.1 经济意义检验:检验模型是否符合经济意义,求得的参数估计值的符号与大小是否合理,是否与根据经验和理论所拟定的期望值相
4、符合1.2 统计检验:运用数理统计的方法,对方程进行检验、对模型参数估计值的可靠性进行检验。主要包括拟合优度检验、方程显著性检验和变量显著性检验,即常用的R 2检验、F检验和t检验1.3 计量经济学检验:回归分析法假设随机干扰项在不同的样本点之间是不相关的,为了检验回归模型是否存在序列相关,通常采用杜宾瓦森检验、拉格朗日乘数检验等;假设随机干扰项具有不同的方差,为了检验回归模型是否存在异方差性,通常采用图示检验法、G-Q检验法等1.4 模型预测检验:由模型的应用要求决定,主要检验模型参数估计量的稳定性等,通常采用虚拟变量法检验模型的结构稳定性2 模型设定2.1 由于非线性模型的假设检验都涉及到
5、非常复杂的数学计算,所以我们考虑做一个线性模型(对参数线性),这样各种检验的方法较多,对模型准确程度的分析也更可靠2.2 私人汽车这种高档消费品的拥有量显然与居民收入有关,因此引进解释变量国民总收入(GNI),并先验预期两者呈正相关关系2.3 我们预计私家车市场的发展与其主要原材料钢材的生产有一定的关联,所以引进解释变量钢材产量,并先验预期其与私人汽车拥有量呈正相关2.4 我们将引入趋势变量t,理由如下:(1)为了分析私人汽车市场的发展与时间的关系;(2)趋势变量t可代替一个影响应变量的基本变量,如科技进步或交通状况变化等不宜直接观测和难以得到数据的变量;(3)避免谬误相关,例如:只用私人汽车
6、拥有量对国民总收入做回归,即使得到一个很高的R 2值,也未必反映了两者之间的真实关联,它可能仅仅反映出两个变量的共同趋势。2.5 对于国民总收入和钢材产量这些国民经济指标,我们更关心其相对数变化对私人汽车拥有量的影响,所以采用对数模型综上所述,我们采用的模型如下: lnYt= 0+ 1lnX1t+ 2lnX2t+ 3t+ t其中,Y t=私人汽车拥有量(万辆)X1t=国民总收入(亿元)X2t=钢材产量(万吨)t=趋势变量3 数据我们选择了中国统计出版社出版的2006年中国统计年鉴中1989年一2005年共17年的相关数据:年份 t Yt X1t X2t1989 1 73.12 17000.9
7、4859.001990 2 81.62 18718.3 5153.001991 3 96.04 21826.2 5638.001992 4 118.20 26937.3 6697.001993 5 155.77 35260.0 7716.001994 6 205.42 48108.5 8428.001995 7 249.96 59810.5 8979.801996 8 289.67 70142.5 9338.021997 9 358.36 77653.1 9978.931998 10 423.65 83024.3 10737.801999 11 533.88 88189.0 12109.782
8、000 12 625.33 98000.5 13146.002001 13 770.78 108068.2 16067.612002 14 968.98 119095.7 19251.592003 15 1219.23 135174.0 24108.012004 16 1481.66 159586.7 31975.722005 17 1848.07 183956.1 37771.14Yt =私人汽车拥有量(万辆) X 1t =国民总收入(亿元) X 2t =钢材产量(万吨) t=趋势变量4 回归结果及其含义我们根据上述时间序列数据,采用最小二乘估计法(OLS),结果如下(使用Eviews软件,
9、下同):Variable Coefficient Std. Error t-Statistic Prob. C 0.498833 1.005588 0.496061 0.6281LOG(X1) 0.204958 0.062491 3.279821 0.0060LOG(X2) 0.184975 0.070529 2.622689 0.0211T 0.152752 0.014889 10.25964 0.0000R-squared 0.999129 Mean dependent var 5.864478Adjusted R-squared 0.998929 S.D. dependent var 1
10、.034732S.E. of regression 0.033870Akaike info criterion -3.730261Sum squared resid 0.014913 Schwarz criterion -3.534211Log likelihood 35.70722 F-statistic 4973.364Durbin-Watson stat 1.311222 Prob(F-statistic) 0.000000一般可写出如下回归分析结果:lnYt=0.499+0.2051nX1t+0.1851nX2t+0.153t(0.496)(3.28) (2.62) (10.26)RU
11、2=0.9991, F=4973.36, D.W=1.311 其中括号内的数为相应参数的t检验值,R 2是可决系数,F与D.W是有关的两个检验统计量。截距项的t值表现为不显著,且对其机械的解释也没有什么经济意义。可决系数R 2=0.9991,表明模型在整体上拟合得非常好。从斜率项的t检验值看,均大于5%显著水平下自由度为n-k-1=17-3-1=13的临界值t 0.025(13)=2.160,因此所有变量参数都是显著的,且符号也是合理的。lnX1t 的系数0.205表示,在样本期间即19892005年间,保持其他变量不变,平均而言,国民总收入GNI每增加1,私人汽车拥有量增加20.5;lnX2
12、t的系数0.185表示,在样本期间即19892005年间,保持其他变量不变,平均而言,钢材产量每增加1,私人汽车拥有量增加18.5 ;t的系数0 .153表示,在样本期间即19892005年间,保持其他变量不变,平均而言,每年私人汽车拥有量增加15.3;R2值0.9991表明,在19892005年间,私人汽车拥有量的99.91可由其他三个变量的变化来解释。5 检验5.1 验证加入趋势变量t的合理性假设H 0: 3=0,相当于剔除趋势变量t,做回归lnYt= 0+ 1lnX1t+ 2lnX2t+ tOLS估计结果如下:lnYt= -9.732+0.7531nX1t+0.7801nX2t(-25.
13、81)(7.99) (6.68)RR2=0.9921, F=876.91, D.W=0.404F=(R U2- RR2)/q/(1- R U2)/n-(k+q+1) =(0.9991-0.9921)/1/(1-0.9991)/17-(2+1+1)=101其中,n=样本容量q=剔除掉的解释变量个数k=原模型中解释变量的个数遵循自由度为1和13的F分布,在1%的显著性水平下,自由度为(1,13)的F分布的临界值为F 0.01(1,13)=10.04F=101,即在1%的显著性水平上,这个F值也显然是显著的。所以我们拒绝H 0假设并做出结论:引入趋势变量t显著地增大R 2值,由此证明,我们将趋势变量
14、t引入模型中是合理的。5.2 检验样本回归的总显著性由F检验对样本总显著性检验的思想,我们假设:H0: 1= 2= 3=0F= (RU2/k)/(1- RU2)/(n-k-1)=(0.9991/3)/(1-0.9991)/(17-3-1)=4810.48遵循自由度为3和13的F分布,在1%的显著性水平下,自由度(3,13)的F分布的临界值为F 0.01(3,13)=5.74F=4810.48,即在1的显著性水平上,这个F值也显然是显著的。从而我们拒绝lnY与lnX 1、lnX 2和t无线性关系的虚拟假设。5.3 用杜宾瓦森检验自相关H0:=0,即 t不存在一阶自回归d= t=2n( t- t-
15、1) 2/ t=1n t2=1.311由杜宾瓦森表我们找出,对于n=17,k=4(包含常数项),在0.05的显著性水平下,d l=0.90,du=1.71,由于dl1.311du,处于不能确定的区域,故采用如下另一种检验自相关的方法。5.4 利用拉格朗日乘数检验自相关含2阶滞后残差项的辅助回归为:Variable Coefficient Std. Error t-Statistic Prob.C 0.252474 1.028087 0.245577 0.8105LOG(X1) -0.025981 0.066082 -0.393165 0.7017LOG(X2) -0.000136 0.0694
16、10 -0.001960 0.9985T 0.004045 0.015286 0.264634 0.7962RESID(-1) 0.205816 0.278342 0.739435 0.4751RESID(-2) -0.447969 0.297487 -1.505847 0.1603R-squared 0.193001 Mean dependent var -5.49E-16Adjusted R-squared -0.173817 S.D. dependent var 0.030530S.E. of regression 0.033077 Akaike info criterion -3.70
17、9400Sum squared resid 0.012035 Schwarz criterion -3.415324Log likelihood 37.52990 F-statistic 0.526150Durbin-Watson stat 1.897380 Prob(F-statistic) 0.752290R2=0.193,于是LM=(n-2)R 2=(17-2)0.193=2.895,该值小于显著性水平为5%,自由度为2的 2分布的临界值 20.05(2)=5.99,且参数的t检验概率都比较大,由此判断原模型不存在序列相关性。5.5 用虚拟变量法检验模型的结构稳定性改革开放以来,我国汽车
18、产业发展波动频繁,特别地,19941998年经历了长达五年的低速增长期,直到1999年初我国车市才走出谷底,开始平稳回升,所以引进虚拟变量Di=0,如果观测属于1999年前Di=1,如果观测属于1999年后所以n 1=10,n 2=7,做以下回归:lnY t= 0+ ,0Di+ 1lnX1t+ ,1(DilnX1t)+ 2lnX2t+ 2,(DilnX2t)+ 3t+ 3,(Dit)+ t 利用表中数据,OLS估计结果为:Variable Coefficient Std. Error t-Statistic Prob. C -0.475937 1.635973 -0.290920 0.7777
19、DI 5.235603 5.275246 0.992485 0.3469LOG(X1) 0.502597 0.133379 3.768176 0.0044DI*LOG(X1) -0.867703 0.674077 -1.287246 0.2301LOG(X2) -0.033121 0.235724 -0.140508 0.8914DI*LOG(X2) 0.430040 0.425151 1.011499 0.3382T 0.110573 0.023024 4.802544 0.0010DI*T 0.065531 0.059033 1.110072 0.2957R-squared 0.99953
20、3 Mean dependent var 5.864478Adjusted R-squared 0.999170 S.D. dependent var 1.034732S.E. of regression 0.029803Akaike info criterion -3.883233Sum squared resid 0.007994 Schwarz criterion -3.491133Log likelihood 41.00748 F-statistic 2753.956Durbin-Watson stat 1.633947 Prob(F-statistic) 0.000000lnYt=-
21、0.476+5.236Di +0.5031nX1t-0.868(DilnX1t) -0.0331nX2t+0.430(1nDiX2t)+0.111t+0.066(Dit)(-0.29)(0.99) (3.77) (-1.29) (-0.14) (1.01) (4.803) (1.10)R2=09995, F=2753.956, D.W=1.63 如该回归所表明的,含D i项的t检验值均小于5%显著水平下自由度为n-k-1=17-4-1=12的临界值t 0.025(12)=2.179,即参数显著等于0,这表示了两个时期的回归并无显著差异,因而该模型具有结构稳定性。5.6 用图示法检验模型的异方差
22、性我们得到残差平方项e i2 与lnX 1t的散点图如下:从图中可以看出,我们未发现这两个变量有任何系统性联系,表明了数据中也许没有异方差。当然,图解法只是一种非正式的方法,下面,我们用一种正式方法来检验异方差。5.7 用G-Q检验模型的异方差性将原始数据按X 1t排成升序,去掉中间的三个数据,得到两个容量为7的子样本。对两个子样本分别作OLS回归,求各自的残差平方和RSS 1和RSS 2:子样本1:lnYt=-5.221+0.7741nX1t+0.2311nX2t+0.019t(-6.58)(17.91) (2.43) (1.56)R2=0.9999, RSS 1=0.000174子样本2:
23、lnYt=4.760-0.3651nX1t+0.3971nX2t+0.176t(1.57)(-0.92) (1.87) (5.37)R2=0.9992, RSS 2=0.000969计算F统计量:F= RSS2/ RSS1=5.57在5%的显著性水平下,自由度为(3,3)的F分布的临界值为F0.05(3,3)=9.285.57,据此接受两组子方差相同的假设,表明该总体随机干扰项不存在异方差。6 预测2007年2月28日国家统计局发布的中华入民共和国2006年国民经济和社会发展统计公报中显示:2006年我国国内生产总值(GDP)为209407亿元,钢材产量为46685.43万吨,由于2006年国
24、民总收入(GNI)的具体数据仍未公布,且从往年数据看来其与GDP在数值上相差很小,所以采用GDP以代替之,来对模型进行2005年私人汽车拥有量的预测:lnY2006=lnY18=7.754Y2006=Y18=2330.03(万辆)此为对应于X 1t=209407(亿元)即lnX 1t=12.252035,X 2t=46685.43(万吨)即lnX2t=10.75119,t=18所得到的真实值的最优估计,其真实值的95置信区间为:7.68539 lnY 2006 7.81531 即2006年私人汽车拥有量Y 18的95置信区间为:2176.32(万辆)Y 20062478.25(万辆)这就是说,
25、给定X 1t=209407(亿元),X 2t=46685.43(万吨),t=18,在重复抽样中,每100个类似于2176.32 (万辆),2478.25 (万 辆)的区间,平均将有95个包含着真实值。从我们的模型可以看出,19892005年正是我国改革开放渐进式发展的时期,随着改革开放的不断深入与加强,经济稳定持续增长,作为重要工业原料的钢材的产量保持了逐年上升的趋势,国民总收入也保持了每年持续的高增长水平,私人汽车作为高档消费品,每年也保持了较高的增长,它已经以越来越快的步伐步入我国的普通家庭。以我们的模型为依据,随着时间的延续,及我国钢材产量和国民总收入的逐年上升,我国私人汽车有量将逐年增多,成为我国普通大众的消费品。参考文献1(美)古扎拉蒂计量经济学M.北京:中国人民大学出版社,20002 李子奈、潘文卿.计量经济学M.北京:高等教育出版社,20053中华人民共和国国家统计局2006年中国统计年鉴R北京:中国统计出版社,20064王;商民五次扩张期显现汽车产业发展走势N中国信息报,2003226(5)5中华人民共和国国家统计局中华人民共和国2006年国l气经济和社会发展统计公报Rhttp:wwwstatsg0vcntjgbndtjgbqgndtjgbt20060227-402307 796hun,2006228作者简介韩雪、李潜,华中科技大学经济学院。