1、影响考研人数的因素分析摘 要随着经济的不断发展,一方面社会对人才的需求日渐提高,另一方面我国的就业形势日趋严峻,这样直接导致越来越多的大学生选择考研,考研人数总的发展趋势是增加的,与此同时近年研究生的就业也存在也日趋严峻的问题,所以系统地研究考研人数及其影响因素是很有必要的本文的主要研究内容就是要通过运用统计预测与决策、数学模型及相关知识来分析影响考研人数变化的部分主要因素,通过这些分析,我们将看到统计预测与决策及数学模型在发展趋势预测类问题研究中的重要作用,并最终建立合理的数学模型来预测分析考研人数发展趋势关键词:统计预测与决策 趋势分析 干预分析 多元回归IAnalysis of The
2、Number of Postgraduate Entrance ExaminationGe Pengfei Directed by Instructor Jiang Shutao ABSTRACTWith the continuous economic development, increasing social demands for talents on the one hand, on the other hand our countrys employment situation is getting worse, which led directly to more and more
3、 students are choosing articles by the examination overall development trend is the increase in the number, while employment of the graduates in recent years are becoming increasingly serious problems also exist, so systematic study of postgraduate entrance examination and its influencing factors in
4、 the number is necessary. The main content of this article is to use statistical knowledge about mathematical model for forecasting and decision making, and to analyse the factors affecting the articles by some of the main changes in the number, and through these analyses, we will see the statistica
5、l and mathematical model for forecasting and decision in the important role of development trend in the study of such problems, and ultimately to establish a rational analysis of mathematical models to predict graduate population trends.KEY WORDS:Statistical forecasting and decision-making Trend ana
6、lysis Intervention analysis Multiple regression目 录摘 要 .I英文摘要 .IIII前 言 .11 知识储备 .21.1 统计预测的基础介绍 .21.1.1 应用与方法 .21.1.2 统计预测的原则和步骤 .21.2 应用预测分析方法概述及实施 .21.2.1 干预分析模型预测法 .21.2.2 多元线性回归预测法 .32 变量的选取 .43 模型的建立 .53.1 制作曲线图观查曲线走势 .53.1.1 确立初步模型 .53.1.2 分离数据,估算参数 .63.1.3 计算净化序列建立拟合模型 .63.1.4 组建干预模型 .73.1.5 预
7、测对比 .73.2 多元线性回归预测模型 .83.2.1 模型的建立 .83.2.2 模型的检验 .83.3 模型小结 .124 总结和建议 .13参考文献 .14附 录 .15致 谢 .170前 言最近几年考研人数发展总趋势是持续增长的,为何会有这么多的学生选择考研呢?2014 年之前近 20 年内除了 2008 年以外考研报名人数增长率均大于零,2014 年全国硕士研究生招生考试报名人数大约为 172 万,比 2013 年减少 4 万人;但是其中专业学位硕士报名人数 68 万人,有所增长比 2013 年增加了 9 万人2014 年全国研究生招生数据调查报告显示,2014 年全国硕士研究生报
8、考热度趋缓,近 20 年内,考研报名人数继 2008 年首次下降之后,2014 年出现第二次下降全国各地考研报名人数均呈现不同程度下降趋势,如北京、河北、湖北分别下降7.6%、3.8%、1.24%随着社会的不断发展,越来越多的大学生不再满足于本科学历,同时还有就业压力的负面影响,对于大学生考研的研究,越来越受学者们的青睐,各类研究方法层出不穷与此同时随着大数据时代的来临,以及电子计算机技术的迅猛发展,统计学的越来越被各类知名学府所重视,统计学被广泛的应用在预测各类问题的发展,发现事物内部各因素之间的关系,本文主要应用了统计学里的统计预测与决策这一工具来分析影响考研人数的因素,进而抓住主要因素,
9、构建合理预测模型,尽量相对准确的预测未来考研人数增长的趋势虽然 2014 年考研大军的增速有所减缓,但是考研人数发展的大趋势还是增长的,本文运用所学统计学知识,干预分析就是从定量分析的角度来评估政策干预或突发事件对经济环境和经济过程的具体影响,而多元回归分析就是研究影响因变量的主要因素的一种模型,所以主要是应用了干预分析模型和多元回归分析两种方法排除某些干预因素研究考研人数发展趋势及分析对考研人数增减有影响的部分主要因素,建立考研人数关于失业率,教育经费及大学生基数等等主要因素的回归模型,相对准确的预测考研人数,并找出影响考研人数的最主要因素,最后给出相应的不成熟的针对性的建议,将对小到学校院
10、系合理制定针对本系本科生考研的激励政策,大到国家政府制定科教兴国,解决大学生就业问题等的重大举措,都有一定的参考意义,合理的人才结构是一个社会健康发展所必不可少的条件,考研人数变化的背后,是各种因素影响的结果。我们研究研究生人数发展的主要影响因素,进而检验社会各方面采取合理措施,合理改善这些方面因素的影响,使得研究生人数变动真正成为我国人才结构合理化发展的晴雨表11 知识储备1.1 统计预测的基础介绍预测就是根据过去和现在的数据来估计未来,预测未来统计预测归属于预测方法研究范畴,即怎样利用科学的统计学方法对事物的未来发展进行定量推测 11.1.1 应用与方法在市场经济条件下,预测的作用通常是经
11、由各个企业或行业内部的行动计划和决策来实现的; 统计预测作用的大小主要是由预测结果所产生的效用的多少决定的统计预测方法可归纳分为定性预测方法和定量预测方法两类,其中定量预测法又可大致分为回归预测法和时间序列预测法; 按预测时间长短,分为近期预测、短期预测、中期预测和长期预测 2本文主要应用的方法是定量预测法,其中主要运用了多元线性回归预测法和干预分析模型预测法1.1.2 统计预测的原则和步骤原则:连贯原则,指事物的发展是按一定规律进行的,在其发展过程中,这种规律贯彻始终,不应受到破坏,它的未来发展与其过去和现在的发展没有什么根本的不同; 类推原则,指事物必须有某种结构,其升降起伏变动不是杂乱无
12、章的,而是有章可循的,事物变动的这种结构性可用数学方法加以模拟,根据所测定的模型,类比现在,预测未来 3步骤:第一步:确定预测目标,第二步:搜索审核资料,第三步:选择预测模型和方法 ,第四步:分析预测误差,改进预测模型,第五步:提出预测报告1.2 应用预测分析方法概述及实施定量预测法注重于事物发展在数量方面的分析,重视对事物发展变化的程度做数量变化的描述,更多地依据历史统计资料,较少受主观因素的影响 4本文主要运用干预分析模型预测法、多元线性回归预测法1.2.1 干预分析模型预测法干预的含义:时间序列经常会受到某些特殊事件及态势的影响,称这类外部事件为干预2研究干预分析的目的是从定量分析的角度
13、来评估政策干预或突发事件对经济环境和经济过程的具体影响利用干预影响发生前的已知数据,建立一个单变量的时间序列模型,然后利用该模型进行外推预测,求得新的预测值,作为不受干预影响的具体数值,最后用实际值减去预测值,得到的是受干预影响的具体结果,利用这些结果就可以求估干预模型的各个参数一是:利用干预影响产生前的数据,建立单变量的时间序列模型然后利用此模型进行外推预测,得到的预测值,作为不受干预影响的数值二是:将实际值减去预测值,得到受干预影响的具体结果,利用这些结果估算干预影响的参数三是:利用排除干预影响后的全部数据,识别与估计出一个单变量的时间序列模型最后:求出总的干预分析模型1.2.2 多元线性
14、回归预测法社会经济现象的发展变化往往会受到多个因素的影响,因此,一般要进行多元回归分析,我们把包括两个或两个以上自变量的回归分析称为多元回归分析多元回归与一元回归类似,一般运用最小二乘法估计模型参数,最后需要对模型及模型参数进行统计检验(1) 二元线性回归模型(以二元线性回归模型为例) ii xay210类比使用最小二乘法的方法对参数进行估计 (2) 拟合优度指标检验标准误差:对 y 值与模型估计值之间的离差的一种度量 其计算公式为: 3)(2nySE(3) 可决系数的计算及检测 可决系数公式: 2-2)(1yR表示回归模型不能对因变量 y 的变差做出任何解释; 02R表示回归模型对因变量 y
15、 的全部变差做出解释 13(4) 置信范围的计算置信区间的计算公式为: 置信区间= SEtyp其中 是自由度为 的 统计量数值表中的数值, 是观察值的个数, 是包括因变ptt nt量在内的变量的个数(5) 自相关和多重共线性问题自相关检验 :多元线性回归模型的基本假设之一就是模型的随机干扰项相互独立即不相关,实际问题中的自相关往往是由于:变量固有惯性、模型设定偏误、数据的“编造”等原因,如果存在自相关会对参数的估计产生许多不良后果,主要运用 D-W检验法检验D-W 值的计算 niiiiWD121)(-其中:iiiy多重共线性检验:模型中的各个自变量所提供的是各个不同因素的信息,并且回归分析的基
16、本假定里,假定各自变量同其他自变量之间是显著无关的,但是,实际上两个自变量之间可能存在相关关系,这种关系会导致建立错误的回归模型以及得出使人误解的结论为了避免这个问题,有必要对自变量之间相关与否进行检验 5任何两个自变量之间的相关系数为: 2y-)()(xr经验法则认为,两个自变量的相关系数的绝对值小于 0.75 或者 0.5,表示这两个自变量之间不存在多重共线性问题如果某两个自变量之间存在高度相关的关系,就有必要把模型中的其中一个自变量删去2 变量的选取影响考研人数的定量因素有很多例如:应届本科毕业生人数、就业情况、GDP、招生人数、教育投入、在校学习成绩等等,考虑到数据的可获性及对考研人数
17、影响的重要性,选取影响考研人数变动的的几个主要定量因素如下:失业率 代表就业情况;1x普通本科生毕业数 代表研究生人数的基数;教育经费 代表国家对大学生考研2x 3的助力;研究生招生人数 代表社会和国家对研究生的需求量4kn43 模型的建立3.1 制作曲线图观查曲线走势运用 spss 软件制作考研人数随时间变化的时间序列线性图 3-1图 3-1由曲线走势图 3-1 看出 2008 年和 2014 年数据走势和大体走势明显有差异,绝对数也验证了这一点 2008 年和 2014 年是近 20 年内仅有的两次人数下降,由于 2014 年后的数据缺失本文以 2008 年为例运用干预分析模型进行分析,建
18、立模型预测考研人数 (数据见附录)3.1.1 确立初步模型根据 19982007 年的数据建立一个时间序列模型:其中,t 为自变量,t 表示时间, 表示干预事件对因变量的影响,它的确定是tz整个模型的关键由于干预的影响是逐渐加强的,它的作用又是长期并且深远的,因此,干预变量可选以下的形式: TttSBz1其中: 年 及 其 后年 前208,Ttttt Zax2105对 19982007 年的数据建立一个时间增长模型,由图像看出比较接近多项式增长模型 2.3908.413.256ttxt 运用 spss 软件对多项式增长模型做以下模型分析和检验表 3-1 F检验表模型 平方和 Df 均方 F S
19、ig.回归 13787.617 2 6893.809 139.568 .000a残差 345.757 7 49.394 - -1总计 14133.374 9 - - -表 3-2 R方检验表模型 R R 方 调整 R 方 标准估计的误差1 .988a .976 .969 7.02807由表 3-2 看出 R,R 方,调整 R 方以及表 3-1 的 F 值数值都说明该模型拟合度较好,可以通过参数的显著性检验和整个回归方程的显著性检验3.1.2 分离数据,估算参数在此基础上分离出干预因素影响的具体数值,并估算干预模型的参数,用刚才的模型进行 2008 到 2014 年考研人数的预测,然后用实际值减
20、去预测值得到的差值,就是 08 年产生的干预值, 记为 Zt 所求具体数值见下表 3-3:表 3-3 干预值表T 2008 2009 2010 2011 2012 2013 2014Zt -35.025 -48.1013 -50.5756 -59.348 -64.9184 -75.3868 -101.053利用上表 3-3 的数据,可以估算出干预模型: TttSBz1的参数 与 ,实际上是自回归方程: 的参数: tt298.,5.60即: 511ttz3.1.3 计算净化序列建立拟合模型6净化序列是指消除了干预影响后计算得到的序列,它是由实际的观察序列值减去干预影响值后得到的,即: ttzxy
21、-对净化系列 建立时间序列模型如下:ty 20.95-1.42.3ttyt表 3-4 F值检验表模型 平方和 Df 均方 F Sig.回归 198126.859 2 99063.430 1436.318 .000a残差 965.585 14 68.9701总计 199092.445 16a. 预测变量: (常量), t, VAR00001b. 因变量: VAR00003表 3-5 R方检验表模型 R R 方 调整 R 方 标准估计的误差1 .998a .995 .994 8.30484a. 预测变量: (常量), VAR00004, VAR00001R,R 方,调整 R 方均比优化前优越说明:
22、该模型拟合度较好,可以通过参数的显著性检验和整个回归方程的显著性检验3.1.4 组建干预模型通过以上各步的参数估计,可以组建最终的干预分析模型如下: Ttt SBtty298.15600.-15.492.32其中: 年 及 其 后年 前,TtS3.1.5 预测对比利用干预分析模型计算出的预测值 与原始数值 比较如下表:txtx表 3-6 预测值表1998 1999 2000 2001 2002 2003 2004 2005 200627.143 32.271 39.585 49.085 60.771 74.643 90.701 108.945 129.3752007 2008 2009 2010 2011 2012 2013 2014132.097 106.743 107.578 131.803 145.619 168.024 182.819 169.404进一步做对比图 3-2: