1、逐步回归在中国粮食总产量分析和预测中的应用【摘要】本文运用逐步回归分析方法对 1985 年至 2013 年近 30 年间中国粮食总产量的变化趋势进行分段研究,分析了中国粮食总产量的影响因素,以及影响因素的边际效应,并根据最优回归模型对中国粮食总产量的未来趋势进行预测,最后给出政策建议。 【关键词】中国粮食总产量 因素分析 预测 逐步回归分析 我国自古以来就是个农业大国,我们的粮食供应绝大部分依靠自身内部自给自足。粮食作为关系到国计民生的战略物资,其重要程度可以和石油媲美。1985-2003 年期间,中国的粮食总产量经历了上升、下降、上升的变化趋势(如图 1) 。 1985-1996 年中国粮食
2、总产量呈上升趋势,在 1996 年到达第一个峰值;1997-1999 三年保持基本稳定之后,2000 年开始出现了下降趋势;直到 2003 年粮食总产量扭转了下降趋势,并在接下来的十年期间持续增加。粮食总产量是国家安全的重要保障,做好粮食总产量的分析和预测十分必要。 中国粮食的供求问题一直是历年来我国学者密切关注的主题。迄今为止已经有不少相关研究。傅德印对我国粮食总产量的显著影响因素分段进行了研究,蒋乃华对价格对我国粮食生产的影响进行了实证分析,吴玉鸣对中国粮食生产主要影响因素进行了多因素分析,刘晓娥对各种粮食产量预测模型进行了比较分析,张晋科对中国粮食产量和耕地的粮食生产能力进行了对比研究。
3、 但是,建立一般的多元线性模型,由于各个影响因素之间存在多重共线性,而且有的因素影响不显著,使得模型的应用受到了很大的限制。为此,本文的目的在于利用逐步回归分析方法,对中国粮食总产量的影响因素进行分析,并对未来中国粮食总产量的变化趋势进行预测。 一、模型及分析思路 逐步回归分析是进行因素分析和预测的重要统计方法之一。根据逐步回归分析理论,以中国粮食总产量为因变量,各个影响因素为自变量,筛选出所有对因变量影响显著的变量,最终建立最优回归模型如下: 其中,y 表示粮食总产量,x1,x2xp 表示最终筛选出的影响因素。利用模型中的回归系数可以进行各个影响因素的边际分析。 二、中国粮食总产量的因素分析
4、 根据上述建模思路和方法,我们选择了 1985-2013 年中国粮食总产量(万吨)数据以及粮食作物播种面积(千公顷) 、有效灌溉面积(千公顷) 、农用化肥施用折纯量(万吨) 、受灾面积(千公顷) 、乡村就业人员(万人) 、农业机械总动力(万千瓦) ,来分别代表生产和市场两方面对粮食总产量的各种影响因素(原始数据见附表 1) 。 鉴于 1985-2013 期间粮食总产量经历了从上升到下降再上升的趋势,我们分析时采取分段建立模型。 (一)1985-1996 期间总产量呈上升趋势的模型 选择中国粮食总产量(万吨) (y)以及粮食作物播种面积(千公顷)(x1) 、有效灌溉面积(千公顷) (x2) 、农
5、用化肥施用折纯量(万吨)(x3) 、受灾面积(千公顷) (x4) 、乡村就业人员(万人) (x5) 、农业机械总动力(万千瓦) (x6) ,运用逐步回归方法选择最佳变量并建立最优模型,具体输出结果如下: 逐步回归过程中一共进行了三步模型筛选,第一步是 x2 进入模型,第二步 x4 进入模型,第三步 x6 进入模型,最终模型中保留了x2、x4、x6 三个变量。对应于表 3 中每一步变量筛选后的拟合优度检验,可以看到模型拟合优度值从 0.912 增加到 0.996,证明了筛选变量的合理性。方差分析结果表明模型能够通过显著性检验。方差膨胀引子 VIF 显示,模型的多重共线性并不严重。 在上述模型的基
6、础上,我们可以得出两点结论: 第一,1985-1996 粮食总产量呈上升期间,尽管粮食总产量影响因素较多,但影响显著的因素主要是有效灌溉面积、受灾面积和农业机械总动力。而播种面积因素、化肥因素和劳动力因素对粮食总产量的上升影响并不显著; 第二,有效灌溉面积、受灾面积和农业机械总动力面积对粮食总产量的边际影响分别是 0.991、-0.137、0.289,即有效灌溉面积每增加 1公顷粮食总产量增加 9.9 吨,受灾面积每增加 1 公顷粮食总产量下降 1.4吨,农业机械总动力每增加 1 千瓦粮食总产量增加 0.289 吨。 (二)1996-2003 年期间,粮食总产量由稳定到下降趋势的模型 同样选择
7、上述 6 个影响因素来建立模型,运用逐步回归方法选择最佳变量并建立最优模型,最后筛选出来的三个自变量分别是粮食作物播种面积、乡村就业人员和受灾面积。模型 3 的修正可决系数高达 0.993,而且回归方程和回归系数的显著性检验都能通过。但是粮食作物播种面积和乡村就业人员的 VIF 值较高,都接近 10,而且自变量乡村就业人员的回归系数估计值甚至是负的,这与我们的实际经验判断相违背。因此我们有理由认为自变量乡村就业人员和其他自变量之间存在线性共线性。第一,1996-2003 粮食总产量由稳定到下降期间,尽管影响粮食总产量因素较多,但影响最显著的因素是播种面积的下降,而有效灌溉面积、农用化肥施用折纯
8、量、受灾面积、农村就业人员和农业机械总动力等因素对粮食总产量的下降影响并不显著; 第二,这期间播种面积对粮食总产量的边际影响分别是 0.56,即播种面积每减少 1 公顷粮食总产量减少 5.6 吨。 (三) 2003-2013 年期间,粮食总产量持续上升的模型 选择中国粮食总产量(万吨) (y)以及粮食作物播种面积(千公顷)(x1) 、有效灌溉面积(千公顷) (x2) 、农用化肥施用折纯量(万吨)(x3) 、受灾面积(千公顷) (x4) 、乡村就业人员(万人) (x5) 、农业机械总动力(万千瓦) (x6) ,运用逐步回归方法选择最佳变量并建立最优模型。 修正可决系数为 0.989,且模型和系数
9、的显著性检验均能通过。由模型可得,在 2003-2013 年这十年,对粮食总产量影响显著的因素主要是农用化肥施用折纯量和受灾面积。农用化肥施用折纯量和受灾面积对粮食总产量的边际影响分别是 9.094 和-0.104。即农用化肥施用折纯量每增加 1 吨粮食总产量增加 9.094 吨,受灾面积每减少 1 公顷总产量增加1.04 吨。 三、中国粮食总产量的预测 综合上述因素,且根据 1985-2013 年的数据,运用逐步回归方法,建立最优模型。结果虽然所得模型的修正可决系数达到了 0.988,且模型和系数的显著性检验都能通过,但是自变量农用化肥施用折纯量和农业机械总动力的 VIF 值很大,尤其是农业
10、机械总动力的 VIF 达到了21.313,且回归系数估计值为负,与实际经验判断相违背,因此我们有理由认为自变量农业机械总动力与其余自变量有严重的多重共线性。剔除自变量农业机械总动力,重新建立模型。 最终模型中只保留了 x1、x3、x4 三个自变量。调整后的修正可决系数为 0.985。表 31 中的方差分析,同样也是对应于每一次变量筛选后的模型,最后一次的方差分析结果表明模型能够通过显著性检验。从回归系数表我们可以看出,由于剔除了自变量农业机械总动力,剩余三个变量的 VIF 值都接近 1,成功消除了变量之间的多重共线性。 由模型可得,从长期看,对粮食总产量影响显著的因素主要是粮食作物播种面积、农
11、用化肥施用折纯量和受灾面积。粮食作物播种面积、农用化肥施用折纯量和受灾面积对粮食总产量的边际影响分别是0.645、4.485 和-0.085。即播种面积每增加 1 公顷粮食总产量增加 6.45吨,农用化肥施用折纯量每增加 1 吨粮食总产量增加 4.485 吨,受灾面积每减少 1 公顷粮食总产量增加 0.85 吨。 我们可以依据未来粮食作物播种面积、农用化肥施用折纯量和受灾面积的变化趋势对粮食总产量进行预测。 2003 年以来,粮食作物播种面积呈递增趋势,最近四年平均每年增加 742.45 千公顷;农用化肥施用折纯量呈逐年递增趋势,最近四年平均每年增加 126.88 万吨, ;受灾面积存在波动性
12、,最近四年平均每年受灾面积为 31551.75 千公顷。如果继续呈现这样的趋势,在未来 5 年中,粮食总产量的预测结果如下: 显然,受粮食作物播种面积和农用化肥施工折纯量持续增加的影响,未来几年内,粮食总产量将继续呈现稳定上升趋势,能够保证我国的粮食安全。 四、结论和建议 第一,1985-2013 年期间,中国粮食总产量总的变化趋势是 1985-1996 年呈现上升趋势,经过 1997-1999 年 3 年保持基本稳定后,2000 年后出现了下降趋势一直到 2003 年,2003-2013 年扭转下降,呈现快速上升趋势。 第二,从长期看,粮食作物播种面积、农用化肥施工折纯量和受灾面积是影响中国
13、粮食总产量变化的主要因素。其中在上升趋势过程中,有效灌溉面积、受灾面积和农业机械总动力等因素的影响比较显著,在下降趋势的变化中,播种面积下降的影响最为显著,在第二次上升趋势过程中,农用化肥施用折纯量和受灾面积对粮食总产量影响显著。 第三,受播种面积下降的影响,未来几年内,粮食总产量仍将呈现上升趋势即,能够保证我国的粮食安全。 第四,要继续保持我国粮食总产量稳定的增长,一方面要继续保证种植面积的相对稳定,尽量减少占用耕地面积;二方面要进一步提高粮食生产能力和粮食生产效率;三方面要做好防灾工作,完善面向广大农民的保险机制,尽量减少受灾所带来的损失。目前的粮食总产量还比较依赖播种面积的变化。 参考文献: 1蒋乃华.价格因素对我国粮食生产影响的实证分析J.中国农村观察,1998, (5):14-201 2党安荣,等.建国以来我国粮食单产的时序变化研究J.中国农村观察,1998, (3):7-111 3吴玉鸣.中国粮食生产主要影响因素的多因素动态关联分析J.农业经济问题,1998, (1):38-411 4刘晓娥.关于粮食产量预测模型的比较J.统计与决策,2000, (3):26-321 5傅德印.预测方法与应用M.北京:中国统计出版社,2003.