1、 I CPI 指数影响因素的 实证 研究 摘 要 居民消费价格指数 ( Consumer Price Index) ,简称 CPI,是度量居民生活消费品和服务价格水平随着时间变动的相对数,综合反映居民购买的生活消费品和服务价格水平的变动情况。 消费价格指数与同期的其他的经济因素,如 国内生产总值 GDP、 食品价格指数、银行利率、居民收入、汽油价格 ,同期其他的经济指数等都有着密切的联系,我们利用计量经济学方法 分析 CPI 指数与其他的同期经济因素之间的关系,选择几个合适的模型进行比较分析,最后得出一个较为合适的模型 , 利用较为精确的数 学公式进行描述和预测,深入地研究 CPI 指数,从而
2、进一步地了解到 CPI 指数变化的情况。 查询国家统计局 和江苏统计局 的网站,统计2007 年 1 月到 2012 年 12 月 的全国居民消费价格指数以及其他的相关经济数据,国内生产总值 GDP、食品价格指数、银行利率、居民收入、汽油价格, 商品零售价格指数,农业生产资料价格指数,工业品出厂价格指数, 原材料购进价格指数 , 对找到的数据进行筛选和处理, 先分析每一个经济因素对 CPI 指数的影响程度的大小即每一个因素与 CPI 指数的相关性,同时利用数学软件对每一个因素之间的相关性进行检验和分析, 最后利用 计量经济学中的 回归模型找到 CPI 指数和其他的经济因素的一个合理和稳定的函数
3、关系。 由于影响的居民价格指数的因素比较多,我们 用 两个案例 进行 建模分析。 关键词 : CPI 指数 ; 主成分分析 ; 经济预测 II Abstract Consumer Price Index , what is short for CPI, is a measure of the resident consumer goods and services price level over time and Comprehensive reflection of the residents to purchase consumer goods and services price le
4、vel changes. CPI is connected to many other economic factors such as GDP , the food price index , the interest rate , the price of oil , Retail price index , Price index of agricultural means of production , Ex-factory price index of industrial products , Purchasing price indices of raw materials so
5、 on . We use Principal component analysis model to analyze the relationship between CPI and other economic factors . Also , more and more mathematic functions are used to describe and forecast CPI .Then , the change of CPI is well known . We research CPI and other economic factors from January 2007
6、to December 2012 through State Statistical Bureau ,then , select and copy with these data . Examine and analyze the correlation between each factor by using mathematical software . Finally use Principal component analysis model to find a reasonable and stable function between CPI and each economic f
7、actors .Because the economic factors connected to CPI is too much , we use two cases to analyze . Keywords CPI ; Principal component analysis; economic forecast 1 第一章 绪论 1.1 引言 计量经济学是以一定的经济理论和统计资料为基础,运用数学,统计学方法与电脑技术,以建立经济计量模型为主要手段,定量分析研究具有随机性特性的经济变量关系。主要内容包括理论计量经济学和应用经济计量学。理论经济计量学主要研究如何运用、改造和发展数量统计的
8、方法,使之成为随机经济关系测定的特殊方法。应用计量经济学是在一定的经济理论的指导下,以反映事实的统计数据位依据,用 经济计量方法研究经济数学模型的实用化或探索实证经济规律。 洪永淼( 2007)提出计量经济学在过去的几十年中发展非常迅速,主要有 以下几个原因。第一,经济理论需要实证检验;第二,高质量经济数据的获得已逐渐变得相对容易;第三,计算技术的发展使得数据处理的成本越来越低,计算机升级的速度远远大于经济数据积累的速度。 现代计量经济学实际上是建立在一下基本公理之上的: 公理 1.任何经济系统都可以看作是服从一定概率分布的随机过程。 公理 2.任何经济现象(经济数据)都可以看作是这个随机数据
9、生成过程的实现。 诺贝尔经济学奖获得者克莱因 (R.Klein)这样评价计量经济学:“计量经济学已经在经济学科中居于最重要的低位”,“在大多数大学和学院中,计量经济学 的讲授已经成为经济学课程表中最有权威的一部分”。 著名经济学家、诺贝尔经济学奖获得者萨缪尔森甚至说:“第二次大战后的经济学是计量经济学的时代。” 可见,计量经济学的巨大作用和在经济学中的重要地位。 Eviews 是 Econometrics Views 的缩写,直译为计量经济学观察,通常称为计量经济学软件包。 它的本意是对社会经济关系与经济活动的数量规律采用计量经济学方法 与技术进行“观察”。计量经济学的核心是设计模型、收集资料
10、、估计模型、检验模型、应用模型(结构分析、经济预测、政策评价)。 Eviews 是完成上述任务比较 得力的必不可少的工具。正是由于2 Eviews 等计量经济学软件包的出现,使计量经济学取得了长足的进步,发展成为一门较为实用与严谨的经济学科。 Eviews 是在 Windows 操作系统中计量经济学软件里的世界性领导软件。强而有力和灵活性加上一个便于使用者操作的界面使它成为最新的建模工具和容易实用的软件。由于它革新的图表使用者界面和精密的分析引擎工具, Eviews 是强大、灵活和便于使用的软件。 Eviews 在预测分析、数据分析与评价、金融分析、经济预测、销售预测和成本分析等领域应用非常广
11、泛。 Eviews 软件在Windows 环境下运行,容易上手,使得本来复杂的数据分析过程变得易学易用。 我们通常使用 Eviews 软件进行计量经济学的数据分析工作。 民生问题一直是我国政府关注的重点问题,受到社会和人民的广泛关注。 居民消费价格指数 ( CPI) 与人们的生活息息相关, 直接关系到了我国的民生问题, 研究 CPI 指数与哪些因素有关具有十分重要的意义。影响CPI 指数的因素很多,而且各个因素之间也有着联系,对于一般的研究方法很难得出令人满意的结果。 为了解决可能影响我们最后预测结果的问题,我们选择计量经济学中合适的数学模型,同时使用 Eviews 软件帮助我们对收集到的数据
12、进行模型拟合 。最后,得出我们想要的结果即了解CPI 指数与其他经济变量的关系。 1.2 研究的 背景 居民消费价格指数 ( Consumer Price Index), 简称 CPI,是度量居民生活消费品和服务价格水平随着时间变动的相对数,综合反映居民购买的生活消费品和服务价格水平的变动情况。其统计范围涵盖全国城乡居民生活消费的食品、烟酒及用品、衣着、家庭设备用品及维修服务、医疗保健和个人用品、交通和通信、娱乐教育文化用品及服务、居住等八大类、 262 个基本分类的商品与服务价格。数据来 源于全国 31 个省(区、市 ) 500 个市县、 6.3 万家价格调查点,包括食杂店、百货店、超市、便
13、利店、专业市场、专卖店、购物中心以及农贸市场与服务消费单位等。调查方法采用“定人、定点、定时”直接派人到调查网点采集。 居民消费价格指数与各种经济因素与其他的指数因素有着直接和间接的联系,我们旨在运用 计量经济学模型分析它 们对 CPI 指数的影响,力求达到它3 们之间的一种稳定的函数关系, 从 几个 不同方面 对 CPI 指数进行很好的描述和预测。 1.3 研究的目的及意义 居民消费价格指数主要反映 的是 消费者支付商品和劳务的 价格变化情况,也是一种度量通货膨胀水平的工具,以百分比变化为表达形式。CPI 虽有一定的滞后性 ,但它经常 是市场经济活动与政府货币 和财政 政策的一个重要 的 参
14、考指标。 CPI 稳定、 充分 就业 及 国内生产总值的 增长是最重要的社会经济目标。 一般说来, CPI 增幅大于 3%称为通货膨胀 ( INFLATION) 。而 CPI 增幅大于 5%则为严重通货膨胀( SERIOUS INFLATION)。严重通胀可引起加剧资产价格泡沫、公司投资收益大幅降低、国家竞争力水平下降、资源配置错位,破坏投资环境等,从而对经济产生极大的破坏作用。相反, CPI 处 于负增长称为通货紧缩。通货紧缩对经济增长的影响与经济周期密切相关,经济发展处于正常态势时,通货紧缩不会带来重大困难;当经济处于衰退时,通货紧缩会增加经济复苏的困难。因此,深入研究CPI 指数对研究我
15、国经济有非常重要的意义。 1.4 研究的方法 由于在每一个案例中影响 CPI 指数的经济变量有多个,因此我们选择建立多元回归模型。在建立多元回归模型时,为了更准确地反映事物的特征,人们经常会在模型中包含较多相关解释变量,这不仅使得问题分析变得复杂,而且变量之间可能存在多重共线性,使得数据提供的信息发生 重叠,甚至会抹杀事物的真正特征。为了解决这些问题,需要采用降维的思想,将所有指标的信息通过少数几个指标来反映,在低维空间将信息分解为互不相关的部分以获得更有意义的解释。利用主成分分析可用于解决这类问题。 在案例中,从经济理论来说,各个经济变量存在着相互影响的关系,因此我们利用主成分分析法来解释
16、CPI 指数并且得到让我们满意的分析结果是合适的。 4 第二章 建模方法 2.1 概论 主成分分析 主要用于建立多因变 量与多自变量的统计关系。在回归分析中,当自变量与因变量的个数都比较 多,而 且在自变量和因变量之间均存在 严重的多重 线性相关的 时 候 ,如果采用 了 一般的多元 线性 回归方法,其分析结果的可靠性会比较低 , 如果采用 主成分 分析 ,可以 比较理想 地解决这个问题。主成分分析 模型的推导过程和计算过程都比较复杂, 而且数据 量比较大,如果采用人工计算的话,容易带来计算错误和很大的工作量,所以我们 主要 使用 Eviews 软件, 同时使用 Excel和 Matlab 软
17、件 加以辅助, 运用软件解决 主成分分析 的建模问题。 Excel 和 Matlab 在数据前期的处理阶段,使用 Excel软件整理数据和对数据进行作图,先简单地了解下各个经济变量之间的关系, 利用 Matlab 软件得出各 个经济变量之间的相关系数。 在 利 用 主成分分析 模型求解的核心阶段,使用 Eviews 软件求解 主成分分析 模型,得出多元线性回归的方程和结论 。充分利用数学软件的计算优势,减少人工计算的工作量。 2.2 主成分 分析 模型 主成分分析的数学模型: 对于一个样本资料,观测 p 个变量 pxxx , 21 , n 个样品的数据资料 为: npnnppxxxxxxxxx
18、X212222111211 pxxx , 21 其中: pjxxxxnjjjj ,2,1,21 主成分分析就是将 p 个观测变量综合成为 p 个新的变量(综合变量),即 5 ppppppppppxaxaxaFxaxaxaFxaxaxaF22112222121212121111简写为: pjpjjj xxxF 2211 pj ,2,1 要 求模型满足以下条件: ji FF, 互不相关( ji , pji ,2,1, ) 1F 的方差大于 2F 的方差大于 3F 的方差,依次类推 .,2,1122221 pkaaa kpkk 于是,称 1F 为第一主成分, 2F 为第二主成分,依此类推,有第 p
19、个主成分。主成分又叫主分量。 这里 ija 我们称为主成分系数。 上述模型可用矩阵表示为: AXF ,其中 pFFFF 21pxxxX 21pppppppaaaaaaaaaaaaA 21212222111211A 称为主成分系数矩阵 。 主成分分析的几何解释 : 假设有 n 个样品,每个样品有二个变量,即在二维空间中讨论 主成分的几何意义。设 n 个样品在二维空间中的分布大致为一个椭园,如下图所示: 6 图 7.1 主成分几何解释图 将坐标系进行正交旋转一个角度 ,使其椭圆长轴方向取坐标 1y ,在椭圆短轴方向取坐标 2y ,旋转公式为 c o s)s in( s inc o s212211j
20、jjjjj xxy xxy nj 2,1 写成矩阵形式为: nnyyyyyyY2222111211 XUxxx xxxnn 2222111211c o ss i n s i nc o s 其中 U 为坐标旋转变换矩阵,它是正交矩阵,即有 IUUUU ,1 ,即满足 1cossin 22 。 经过旋转变换后,得到下图的新坐标: 图 7.2 主成分几何解释图 7 新坐标 21 yy 有如下性质: (1)n 个点的坐标 1y 和 2y 的相关几乎为零。 (2)二维平面上的 n 个点的方差大部分都归结为 1y 轴上,而 2y 轴上的方差较小。 1y 和 2y 称为原始变量 1x 和 2x 的综合变量。
21、由于 n 个点在 1y 轴上的方差最大,因而将二维空间的点用在 1y 轴上的一维综合变量来代替,所损失的信息量最小,由此称 1y 轴为第一主成分, 2y 轴与 1y 轴正交,有较小的方差,称它为第二主成分。 2.3 主成分分析的 具体 处理 假设 样本观测数据矩阵为 : npnnppxxxxxxxxxX212222111211第一步:对原始数据进行标准化处理。 )var(* jjijij xxxx ),2,1;,2,1( pjni 其中 ni ijj xnx 11 21 )(11)v a r ( jni ijj xxnx ),2,1( pj 第二步:计算样本相关系数矩阵。 pppppprrrr
22、rrrrrR2122221112118 假定原始数据标准化后仍用 X 表示,则经标准化处理后的数据的相关系数为 : tjnt tiij xxnr 111 ),2,1,( pji 第三步:用雅克比方法求相关系数矩阵 R 的特征值( p 21, )和相应的特征向量 piaaaa ipiii 2,1, 21 。 第四步:选择重要的主成分,并写出主成分表达式。 主成分分析可以得到 p 个主成分,但是,由于各个主成分的方差是递减的,包含的信息量也是递减的,所以实际分析时,一般不是选取 p 个主成分,而是根据各个主成分累计贡献率的大小选取前 k 个主成分,这里贡献率就是指某个主成分的方差占全部方差的比重,
23、实际也就是某个特征值占全部特征值合计的比重。即 贡献率 =pi ii1 贡献率越大,说明该主成分所包含的原始变量的信息越强。主成分个数 k 的选取,主要根据主成分的累积贡献率来决定,即一般要求累计贡献率达到 85%以上,这样才能保证综合变量能包括原始变量的绝大多数信 息。 第五步:计算主成分得分。 根据标准化的原始数据,按照各个样品,分别代入主成分表达式,就可以得到各主成分下的各个样品的新 数据,即 主成分得分。具体形式可如下。 nknnkkFFFFFFFFF212222111211第六步:依据主成分得分的数据,则可以进行进一步的统计分析。 利用标准化的公式还原数据,根据主成分得分,计算得出最终的多元线性回归模型。