1、基于回归分析的煤炭价格预测模型华北电力大学(保定)武小莉 热动 0704王坤 动力实 07张帆 电力实 07基于回归分析的煤炭价格预测模型摘要:本文主要通过分析煤炭价格的变动趋势以及影响煤炭价格的因素,运用数据分析中的回归分析,分别建立了单变量非线性回归模型和多元线性回归预测模型,实现了对煤炭价格的预测。首先通过对我国 1985-2006 年煤炭价格走势的分析,建立了以时间为自变量、煤炭价格为因变量的单变量非线性回归模型,拟合出了煤炭价格随时间的变化规律,此模型能在一定程度上预测出煤炭价格的变化趋势,但运用此模型预测出的 2007 年的煤炭价格与实际值有较大偏差。对照国家相关政策的变动,对原模
2、型产生偏差的原因进行深入分析,发现供求关系是影响煤炭价格的主要深层次因素。选取 1990-2006 年间煤炭的生产量、消费量、进口量、出口量作为自变量,仍以煤炭价格作为因变量,建立了多元线性回归模型,并对此阶段的四个自变量做了时间序列分析,得到了 2007年各个自变量的预测值,继而运用此模型较精确地预测出了 2007 年的煤炭价格。关键词:单变量非线性回归分析、多元回归分析、价格预测一、 问题的提出中国是当今世界上以煤为主要能源的少数几个国家之一,煤炭在中国经济社会发展中占有重要的地位。它不仅是工业部门燃料动力的主要来源,也是重要的化工原料和民用能源,并已成为重要的出口商品。目前,煤炭约占中国
3、一次能源总产量的70%,约占一次能源中消费量的66%(国家统计局,2004d)。未来较长时期内,煤炭仍将是中国能源的支柱,它在国民经济中具有重要的战略地位。近十年来,我国的煤炭价格一直保持大幅度的波动,特别是近几年的煤炭价格上涨已经引起社会的广泛关注。煤炭作为基础能源,需求缺口的拉大,必将导致作为市场信号的价格上扬。客观分析和判定煤炭价格的影响因素,了解并能够预测未来煤炭价格,对于掌握决策的主动权,作出合理的决策,是非常必要的。二、 问题的分析对煤炭价格进行预测,需要掌握一定量的数据。通过查询,可以获得的数据量有:近二十年来煤炭工业产品的出厂价格以及各年的煤炭平衡表。通过对所得数据的分析,发现
4、煤炭价格逐年递增,且随时间成非线性变化。在对整体数据分析的基础上,可以建立煤炭价格与时间的单变量非线性回归方程,继而可根据此回归方程进行价格预测。单变量回归模型仅是单纯地研究了煤炭价格随时间的变化规律,过于简单且表面化。事实上煤炭价格受多方因素的影响,这些影响因素才是煤炭价格变化的根本原因,建立煤炭价格与各影响因素间的回归模型,对未来煤炭价格进行分析预测更具有合理性。在不考虑国家政策强制干预的前提下,决定煤炭价格的主要因素是供需关系。随着煤炭市场的有序放开和煤炭市场化进程的加快,煤炭价格回归理性的预期将会显现。这就需要结合我国煤炭产业的实际情况,重点从煤炭的生产量、消费量、进口量以及出口量对煤
5、炭价格进行统计模拟分析,建立煤炭价格与这些变量的回归模型,从而实现对未来煤炭价格的预测。三、 模型假设3.1 查找得到的数据真实可靠,且煤炭价格为全国平均价格。3.2 多元线性回归模型中,煤炭价格主要受市场条件下的供求关系的影响,建立模型过程中不考虑国家政策的强制干预。3.3 多元线性回归模型中,假设在市场条件下,主要讨论煤炭价格受煤炭生产量、煤炭消费量以及进、出口量的影响,忽略其他影响因素。四、 模型的建立和求解5.1 非线性回归模型5.1.1 模型的建立表 5-1 中给出了 1985-2006 年的煤炭价格。由此作出煤炭价格走势图,如图5-1 所示。图 5.1 煤炭价格(单位:元/吨)通过
6、分析图中价格走势,确定选择指数回归方程作为价格指数的变化趋势的模拟,另在回归方程上加1个三角函数作为周期变化规律的模拟,方程的形式为:(5-1))sin(tBAeyt上式中: 为煤炭价格(元/吨); 为时间(年); 为常数。y ,BA5.1.2 模型的求解与精确度分析取l985年为时间的零点,以下类推,建立煤炭价格与时间之间的回归方程,代入数据,求解方程中各参数,得回归方程为(5-2))425.706.sin(1.2849.31057. tteyt表5-1中给出了由此模型得到煤炭价格的拟合值及残差。表5-1 1985 2006年煤炭价格历史统计数据及模型拟合情况时间( :年)t煤炭实际价格(
7、:元/吨)y煤炭拟合价格( :元/吨)y残差( )ye标准化残差( )MSEe/1985 35.16623 34.5367 0.629524 0.0931171986 34.04091 36.03662 -1.99571 -0.29521987 34.99405 37.05351 -2.05946 -0.304631988 38.70342 38.66935 0.034075 0.005041989 43.42524 42.06388 1.361362 0.2013671990 46.11761 48.19456 -2.07696 -0.307211991 52.15901 57.51428
8、-5.35527 -0.792131992 60.55662 69.79822 -9.2416 -1.366981993 84.59759 84.12863 0.468961 0.0693671994 103.3783 99.05163 4.326626 0.6399761995 115.06 112.8813 2.178707 0.3222651996 130.8232 124.0911 6.732094 0.9957831997 141.2891 131.7096 9.579439 1.4169511998 136.4852 135.6305 0.854772 0.1264341999 1
9、29.388 136.7608 -7.37277 -1.090552000 126.9296 136.9618 -10.0322 -1.483922001 135.1801 138.7782 -3.5981 -0.532222002 150.861 144.9967 5.864307 0.8674242003 161.4212 158.1161 3.305126 0.488882004 187.2486 179.8326 7.415973 1.096942005 221.3279 210.6498 10.67807 1.5794552006 234.1649 249.7037 -15.5388
10、 -2.298448.10 )20,1(F169.4 F(,20) 0.983.2R根据 与 可知,该模型的显著性良好,通过检验。2绘制粮食价格综合指数的理论值与实际值之间的对比图(图5-2),从图中可以看出该曲线对实际值的拟合效果很好,根据理论曲线可以预测未来粮食价格指数的走势。图5-2 实际价格与单变量的非线性模型拟合值的对比5.1.3 模型的检验与结果分析由方程(5-2)预测 2007 年(令 )的煤炭价格为 294.8561 元/吨,而23t2007 年煤炭的实际价格为 246.7395 元/吨,残差值达到-48.1215,标准化残差也已达到-7.1179,残差值突然增大,结果不够理想
11、。分析其原因,本模型由一段时期内的价格走势凭经验建立回归方程,指数部分体现其整体变化趋势,三角函数部分体现其波动的周期性,而实际情况是煤炭价格受多方因素影响,特别是国家政策对其有一个宏观的调控,而这些因素与时间并不存在必然的联系。分析图5-1中的煤炭价格走势,其变化趋势与国家政策的变动紧密相关:1985-1993年间,由价格曲线可知,煤炭价格呈缓速增长趋势,这一时期,执行政策统一定价的煤炭约占46。煤炭价格中政府定价范围缩小,部分定价权下放,市场议价以及议价市场的合法化,使煤炭价格形成机制产生本质性的变化。市场价格在煤炭价格体系中占主导的格局已初步形成,政府定价与市场机制在价格形成中已起着重要
12、的作用。1993年,煤炭价格改革进入新的阶段,确立了以市场形成价格为主的价格机制。到1994年一月份,全国煤炭市场的煤炭价格全部放开,计划内煤炭价格与计划外煤炭价格无区别,全同改变过去一煤多价的价格形式。这一时期,煤炭价格增长迅速,属于本模型中出现的第一个周期的上升阶段,且曲线斜率较大。1997-2001年期间,煤炭价格基本属于下跌之势。究其原因,由于前一时期煤价增长很快,私营煤矿企业和乡镇煤矿企业数量激增,其产煤量几乎占据了全国煤炭产量的半壁江山,这一时期我国煤炭供过于求,导致价格的下跌。而本模型中的曲线也在此进入了第一个下降阶段。2002年我国煤炭价格开始采用完全市场定价制度,但国家发改委
13、仍对电煤市场价格和运输进行干预。2004年,重化工行业崛起,煤电油运全面紧张,从价格曲线可以看出,这一时期的煤炭价格上涨迅速。此后,煤炭市场化改革一年迈出一大步:2005年,基本实现了政府发布原则、框架,企业自主衔接,依法签订合同;2006年,取消电煤价格临时干预,重点运力不再翻版,转而以合同为基础;2007年,取消订货会,引入竞争机制,企业不分所有制和隶属关系,协商定价。政策的频繁变动导致煤炭价格增长速度的不稳定,直观表现为价格曲线不再平滑,其斜率的衔接性变弱。而在模型中曲线波动已发展到第二个周期的上升阶段,由于前一周期的上升速度较快,这一周期继续以较快速度上升,而实际情况是价格上升速度又有
14、减缓趋势,从而导致了预测结果与实际情况的相差较大。由此可知,煤炭价格随时间的变化只是一种表面的现象,其真正的变化规律有着更为深层的影响因素。分析国家政策对煤炭价格变动所造成的影响就会发现,在逐步推进市场化的进程中,市场的供需关系正逐渐成为煤炭价格的主要决定因素,每一次国家政策的变动都会深深影响市场的供求关系,故需深入分析价格与供求量间的关系,建立模型进行求解。5.2多元线性回归预测模型5.2.1 模型的建立对煤炭价格影响因素的研究,国内的学者有众多分歧。在模型中,认为煤炭价格主要受煤炭供求平衡情况影响,建立煤炭价格与煤炭生产量、煤炭进口量、煤炭出口量、煤炭消费量的多元回归模型。从 1990 年
15、到 2006 年的历年的煤炭价格、煤炭生产量、煤炭进口量、煤炭出口量、煤炭消费量的数据如表 5-2 所示。表 5-2 19902006 年煤炭各变量的历史统计数据时间( :年)t煤炭实际价格( :元/吨)y生产量( :万吨)1x进口量( :万吨)2x出口量( :万吨)3x消费量( :万吨)4x1990 46.1176075 107988.3 200.3 1729 1055231991 52.1590141 108740.6 136.8 2000.1 1104321992 60.5566153 111638 123 1966.3 114084.81993 84.5975916 115067 14
16、2.8 1981.5 120919.51994 103.378257 123990.1 120.9 2419.4 128532.21995 115.06 136073.1 163.5 2861.7 137676.51996 130.82322 139669.9 321.7 3648.4 144734.41997 141.289078 137282 201 3073 1392481998 136.485249 125000 158.6 3229.7 129492.21999 129.388016 104500 167.3 3743.9 126365.32000 126.929644 129921
17、 217.9 5506.5 1320002001 135.180071 138152 266 9012.9 1350002002 150.860959 145456 1125.7 8389.6 141600.52003 161.421226 172200 1109.8 9402.9 1692322004 187.248622 199232.4 1861.4 8666.4 1935962005 221.327871 220472.9 2617.1 7172.4 216722.52006 234.164888 237300 3810.5 6327.3 239216.5根据数据,画出煤炭价格与各变量
18、的散点图(如图 5-3 至 5-6 所示) ,同时计算煤炭价格与各变量的相关系数(如表 5-3 所示) 。表 5-3 煤炭价格与各影响变量的相关系数变量组合 1 yx2 yx3 yx4 yx相关系数 0.9029 0.8298 0.7141 0.92631 1.2 1.4 1.6 1.8 2 2.2 2.4x 105406080100120140160180200220240产 产 产产产产产图 5-3 生产量与煤炭价格的散点图0 500 1000 1500 2000 2500 3000 3500 4000406080100120140160180200220240产 产 产产产产产图 5-4
19、 进口量与煤炭价格的散点图1000 2000 3000 4000 5000 6000 7000 8000 9000 10000406080100120140160180200220240产 产 产产产产产图 5-5 出口量与煤炭价格的散点图1 1.2 1.4 1.6 1.8 2 2.2 2.4x 105406080100120140160180200220240产 产 产产产产产图 5-6 消费量与煤炭价格的散点图从以上煤炭价格与各个变量的相关系数与散点图可以看出,煤炭价格与煤炭生产量、进口量、出口量、消费量具有显著的相关性,鉴于此,建立如下模型:(5-3 )13402yxx5.2.2 回归模
20、型参数的求解根据我国 19902006 年关于煤炭价格、煤炭生产量、进口量、出口量、消费量的历史统计数据(见表 5-2) ,对模型(5-3)进行求解,得到各参数和相应的统计指标,如表 5-4 所示。表 5-4 模型参数估计和相应指标参数或指标 01234显著水平2RFp估计值 -131.69568 -0.00149 -0.02078 0.00562 0.00319 0.05 0.939 45.75 0.0001从上表可知, =0.939,即因变量(煤炭价格)93.9%可由模型确定,且2R值超过了 检验的临界值, ,所以模型是可以应用的。将表中回归参数Fp的估计值带入模型(5-3)中,建立起我国
21、煤炭价格与煤炭生产量、出口量、进口量、消费量之间的回归预测模型,即为:(5-4 )312 40.49.078.056.193.658yxxxx5.2.3 采用时间序列预测 2007 年相关变量的值(1)单变量随机线性模型主要有两种:一种为自回归模型 ,其方程为:ARp(5-12ptttttyya5) 式中: 待估自回归参数; 随机冲击,是一个白噪声序列 ,12,p ta服从 ;另一种为滑动平均模型 ,其方程为:(0)NMAq(5-12tttttqya6)式中: 滑动平均参数。12,p对这两种模型的识别主要借助于其自相关函数和偏相关函数,分别定义为(5-7A0kr)(5-AAA1 111, 11, ,kkjkjkKj jjkjKj8) 其中: 1 1,nk nktt tiryyy 若随机序列 的偏自相关函数 在 步以后截尾,即当 时,t kpkp,而且其自相关函数 拖尾,即 随 的增大而衰减,有收敛到零0kk的趋势,则模型为 模型。实际识别时,只要当 时, 在零的上ARpkk下波动,即可认为 是截尾的;若随机序列 的自相关函数 在 步以后ktyq截尾,而其偏自相关函数 拖尾,则模型可识别为 模型。k MA(2)模型的确立对于时间序列,首先要进行模型的识别与定阶,即要判断模型的类别,并估计阶数 ,在此过程中以模型定阶的 准则为判定依据。当模型,pqIC