1、 2010 高教社杯全国大学生数学建模竞赛 承 诺 书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则 . 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的 , 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受 到严肃处理。 我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): B 我们的
2、参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 天津农学院 参赛队员 (打印并签名 ) : 1. 2. 3. 指导教师 或 指导教师组负责人 (打印并签名 ): 日期: 2012 年 8 月 26 日 赛区评阅编号(由赛区组委会评阅前进行编号): 2010 高教社杯全国大学生数学建模竞赛 编 号 专 用 页 赛区评阅编号(由赛区组委会评阅前进行编号): 赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号): 1 基于层次分析法研究生招生分配问题的研究 1 摘要 本文主
3、要 利用 附件中所给 数据 对研究生的名额分配问题进行分析。首先运用主成 分分析模型确 定影响岗位等级的主要因素,其次利用变异系数 法 求出各因素的权重, 进而求出岗位等级相关度,以此来确定所缺数据,最后在 岗位级别的影响因素 下 对研究生名额分配问题进行了建模分析。 问题一 首先,根据 各 岗位等级指标的影响因素,利用主成分分析模型,得出影响岗位等级的主要因素:招生人数、科研经费、发表中英文论文数、申请专利数、获奖数、获得优秀论文数量。其次,利用变异系数法求出各因素的权重,最后根据岗位等级相关度 iki wuQ , 计算出 编码为 18, 103,110,123,150,168,274,32
4、4 的导师,他们的岗位级别分别是:四级,二级,二级,六级,六级,三级,五级,六级,五级,七级。 问题二 在问题一的基础上,我们运用 excel 软件对不同岗位级别的招生人数、科研经费、发表中英文论文数、申请专利数、获奖数、获得优秀论文数量进行统计 作图 分析,得出招生人数,发表英文论文数对导 师岗位级别影响较大,而到帐经费和申请专利数对导师的岗位级别 影响 不大 。 问题三 首先,根据 2007 2011 年的研究生的人数,利用灰色预测模型对 2012 年研究生人数进行预测,经残差检验 ,其相对平均残差为 8.07% %10 ,通过检验,预测出的 2012 年研究生人数为 823。其次,结合问
5、题二的结论和实际情况,我们选择岗位级别、招生类型、申请专利数、 到帐经费作为新的指标,利用层次分析法求出其权重,一致性 比率 为 0.012, 结果 比较理想 。之后利用各指标的权重和预测出的 2012 研究生人数,依据不同指标下的总招生人数 =2012 年研究生总人数各个指标的权值 所属指标的研究生总人数 ,进行研究生名额的分配。 问题四 在问题三的基础上 ,我们考虑到学科特点和学科发展前景对名额分配会产生影响。首先根据横向项目数和纵向科研数对学科特点及各学科人数对学科发展前景进行分析,然后依据分析结果建立层次分析法的判断矩阵,求出各学科的权重。最后利用各学科的权重和问题三的结果重新对研究生
6、名额进行分配。 问题五 结合上述四个问题的结果分析,我们还需得到:对学生英语等级考试的要求、用人单位对毕业生的培养质量反馈信息、地域差异等指标对研究生名额进行更合理的分配。建模思想是通过层次分析法求的权重,进而得到不同层 次的研究生人数。 关键字 : 主成分分析 变异系数 灰色 )1,1(GM 预测模型 层次分析法 2 2 问题的重述 2.1 问题的背景 招生工作作为研究生教育的重要组成部分,是吸引优质生源,保障培养质量的首要环节。作为招生工作的首要任务之一的招生指标的分配,它直接影响研究生的培养质量、学科建设和科研成果。在 2011 年研究生招生改革方案中,将硕士研究生招生指标划分为学术型和
7、专业型两类。这一改革方案的实施,给研究生教育的发展带来发展机遇的同时, 也给指标分配的优化配置提出了新的思考。 2.2 问题的提出 根据附件中所给的数据信息,结合所查资料文献,解决以下问题: 1. 由于统计数据的缺失,第 18、 103、 110、 123、 150、 168、 274、 324、 335、 352位教师的数据不完整,请你用数学模型的方法将这些缺失的数据补充完整。 2. 以前的硕士研究生名额分配方案主要参考导师岗位级别进行分配。请你以岗位级别为指标,分析每个岗位的招生人数、科研经费、发表中英文论文数、申请专利数、获奖数、获得优秀论文数量的统计规律,并给出合理的解释。 3. 根据
8、第二问的结 论,提出更加合理的研究生名额分配方案,使得新方案既兼顾到岗位又能兼顾到其他因素,例如研究生的招生类型等,并要求用此方案对 2012 年的名额进行预分配。 4. 如果在研究生招生指标分配当中,考虑到学科的特点和学科发展的需要,进行差异分配,请你设计调整方案,并用你的方案给出 2012 年的调整方案。 5. 如果想把分配方案做得更加合理,你认为还需要哪些指标数据,用什么方法可以完成你的方案?请阐述你的思想。 3 问题的分析 研究生招生指标的分配,对研究生的培养质量、学科建设和科研成果的取得有直接影响。然而,现在绝大多数高 校主要是依赖指导教师的岗位级别对研究生招生指标进行分配。这使得不
9、同专业出现了“冷门”、“热门”现象,这种现象突出表现为一些对国家不可或缺的学科反而不利于今后的发展。 针对问题一,对所缺失的数据进行补充,首先,我们采用主成分分析法对影响岗位级别的因素进行分析,找出对其影响较大的几个因素。之后以这些因素为主要指标,利用变异系数求各因素的权重,根据各个权重建立相应的关系式,求出所缺岗位级别。 针对问题二,用 excel 软件对不同岗位级别教师的招生人数、科研经费、发表中英文论文数、申请专利数、获奖数、获得优秀论文数量 进行统计作图分析,根据统计图分析各因素对不同岗位级别的影响程度。 针对问题三,首先,利用灰色预测模型对 2012 年的招生总人数进行预测,然后在3
10、 问题二的基础上,重新确定研究生名额分配的指标,再利用层次分析法计算每个指标的权重,根据权重值和预测出的 2012 年的研究生人数,得出 2012 年研究生的预分配方案。 针对 问题四 , 根据分析得出:横向项目数和纵向科研数能够体现学科特点、学科人数能够体现学科发展前景,因此权衡二者关系,依据层次分析法构造判断矩阵,得出各学科的权重。在问题三的基础上,再次对 2012 年研究生人数进行分 配。 针对问题五,根据以上四个问题的求解过程中,所缺少的数据和未考虑的其他指标,如教育政策,社会发展等,再重新制定研究生名额分配方案。 4 问题的假设 1. 假设所用到的数据是真实可靠的; 2. 假设各评价
11、指标之间相互独立,没有影响; 3. 假设所有指标准确反映了招生单位各个学科真实的招生能力; 4. 假设各个学科的导师人数、岗位级别没有较大的变化; 5. 假设每个岗位专家的选择偏好和判断意见对结果不产生影响。 5 符号说明 iF 第 i 个主成份 iw 各因素的权值 R 相关系数矩阵 kU 所 缺岗位等级数集 ijr 相关系数 iQ 岗 位 等级相关度 i 各因素的特征值 2w 权重向量 ie 各因素的特征向量 CR 一致性检验指标 6 模型的建立及求解 6.1 问题一:主成份分析模型 在分析研究生招生指标分配的过程中,我们主要以岗位等级为指标 ,但由于影响岗位等级的因素较多,如招生人数、科研
12、经费、发表中英文论文数、申请专利数、获 奖数、获得优秀论文数量等,因此我们需要对各因素进行分析 。虽然影响因素多,但对岗位等级的影响程度大小不一,所以在此问题中,我们用主成份分析法来求解。 4 6.1.1 主成分分析原理 主成分分析是设法将原来众多具有一定相关性 , 重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来 P 个指标作线性组合 , 作为新的综合指标 。最经典的做法就是用 1F 的方差来表达 , 即 )( 1FVar 越大 ,表示 1F 包含的信息越多。因此在所有的线性组合中选取的 1F 应该是方差最大的 ,故称 1F 为第一主成分。如果第一主成分不足以
13、代表原来 P 个指标的信息 ,再考虑选取 2F 即选第二个线性组合 , 为了有效地反映原来信息 , 1F 已有的信息就不需要再出现在 2F 中 ,用数学语言表达就是要求 0),( 21 FFCov ,则称 2F 为第二主成分 ,依此类推可以构造出第三、第四 , ,第 P 个主成分 。 6.1.2 模型的建立 1.建立原始数据 X ijijXXXXX1111 2.数据标准化。这是为 了使主成分分析能够均等地对待每一个原始变量,消除由于单位的不同可能带来的影响。 3.计算相关系数矩阵 R 。得到的相关系数阵 R ,如果绝大部分相关系数大于 0.3,说明各变量之间有很强的相关性,适合于主成分分析法。
14、 ijijrrrrR1111 其中 ijr 为原变量 iX 和 jX 的相关系数,计算公式为: nkjkjnkikinkjkjikiijxxxxxxxxr12121)()()(4.求出 R 的特征值 i 和特征向量 ie 首先解特征方程 0RI 求出特征值 i ( i=1, 2, p),并使其按大小顺序排列,即 p 21 ,然后分别求出对应于特征值 i 的特征向量 ie 。 5 6.1.3 模型的求解 本文用一级岗位的数据作为原始数据进行主成份分析。利用 Matlab 即可得一级岗位的特征值和特征向量(见附录 1、 2), 表 1 其各因素的特征向量和贡献率。 表 1 各因素的特征向量和贡献率
15、 序号 特征根 方差贡献率 % 累计贡献率 % 1 2.816 31.26 31.25 2 2.2136 24.60 55.80 3 1.3496 15.00 70.80 4 0.9614 10.68 81.48 5 0.6872 7.64 89.12 6 0.4567 5.07 94.19 7 0.3760 4.18 98.37 8 0.1213 1.35 99.72 9 0.0206 0.24 100.00 由上表及计算出的数据可以看出,岗位等级主要由招生人数、科研经费、发表中英文论文数、申请专利数、获奖数、获得优秀论文数量,这些因素起主要作用。 6.1.4 确定因素权重 通过 SPSS
16、软件求出不同级岗位各因素描述统计量,在此只给出一级岗位的计 算数据,如 表 2: 表 2 各因素描述统计量 描述统计量 均值 标准差 招生人数 25.278 4.991 到帐经费合计 77.418 77.321 发表英文论文数 0.888 1.967 中文期刊论文数 5.278 7.607 申请专利数 2.556 5.393 获奖个数 0.222 0.548 获得优硕论文数 0.5 0.618 由变异系数法 iii xsv , iii vvw 得各权值。 1 1 5 9 6.0,2 3 1 3 6 2.0,1 9 7 8 7 7.0 1 3 5 1 3 9.0,2 0 7 4 9 8.0,0
17、9 3 9 3 6 4.0,0 1 8 5 1 7.0 171615 14131211 www wwww利用 matlab 软件编程求解,得出七个等级各因素的权值 iw ,如 表 3 6 表 3 七个等级各因素的权值 岗位 级别 招生 人数 到帐经费合计 发表英文论文数合计 发表中文期刊数合计 申请专利个数 获奖 个数 获优硕论文数 一级岗 0.01851 0.09364 0.20749 0.13513 0.19787 0.23136 0.11596 二级岗 0.04594 0.14292 0.26916 0.20424 0.20398 0 0.13373 三级岗 0.03776 0.0986
18、9 0.11454 0.16026 0.13254 0.34801 0.10816 四级岗 0.03254 0.07985 0.13155 0.10350 0.14218 0.35166 0.15867 五级岗 0.01870 0.08583 0.10369 0.08491 0.14111 0.32792 0.23781 六级岗 0.02196 0.18697 0.28786 0.11486 0.12699 0 0.26133 七级岗 0.02589 0.06539 0.08441 0.05139 0.09168 0.20134 0.47986 6.1.5 确定所缺岗位等级 设所缺岗位等级 数
19、集为 kU , ,., 4321 kk uuuuuU ( 10,.2,1k ); 岗位等级相关度: iki wuQ ,( 7,. . 2,1i ) 岗位等级相关 度 iQ 越大,就说明所求 ku 与 i 级岗位接近程度越高。计算出的七个级别中最大的相关度值,可以近似地认为该相关度所对应的岗位级别就是所要求的缺失数据。 利用 excel 进行数据处理,得到如 : 表 4 空缺岗位级别的导师对各级别的相关度值,表中每个所求数组 ku 对不同岗位级别的相关度值中的最大数据所对应的岗位级别就是最终结果。 表 4 空缺岗位级别的导师对各级别的相关度值 岗位级别 18 103 110 123 150 16
20、8 274 324 335 352 一级岗 11.31 6.15 1.72 0.56 1.01 1.44 8.52 1.4 1.22 0.23 二级岗 18.43 14.78 2.66 0.96 1.61 1.09 12.93 0.56 2.09 0.64 三级岗 12.04 6.52 1.76 0.7 1.14 1.71 8.77 2.62 2.13 1.43 四级岗 22.28 5.29 1.58 0.58 0.93 1.1 7.5 1.03 0.54 1.64 五级岗 10.3 5.57 1.39 0.52 0.93 1.04 16.38 1.54 4.98 10.08 六级岗 9.8
21、14.19 2.58 1.03 1.96 1.36 7.88 2.83 2.37 9.41 七级岗 7.99 4.27 1.5 0.47 0.76 0.75 7.08 1.59 2.05 13.37 由上表所示,编码是 18, 103,110,123,150,168,274,324 的导师,他们的岗位级别分别是:四级,二级,二级,六级,六级,三级,五级,六级,五级,七级。 7 6.2 问题二 基于统计规律分析求解 根据问题一中所得的结果,首先将表中各个数据按照导师岗位级别进行统计分析,求得各个岗位级别在不同指标下的均值,分析相同因素影响下不同级别岗位的变化趋势 首先,分别利用 图表直观地对各个
22、因素的影响进行分析。 图 1 不同级别导师的论文发表的数 从上图可以看出岗位级别越高的导师,其发表论文的篇数越多;而一些级别相对较低的导师,发表的中文论文数目高于高级别导师,可能与导师自身的研究领域、自身追求等相关。 图 2 不同级别导师获得奖励个数 由上图可以看出:专利的申请对于评定导师级别来说影响不大,高级别导师 获得奖励个数与优硕论文较多,这也会导致大部分的考生进行盲目报考,忽略爱好与兴趣。 图 不同级别导师对报考学生的影响 图 3 不同级别导师对招生人数的影响 0123456一级 二级 三级 四级 五级 六级 七级级别论文数英文篇数中文篇数00.511.522.533.5一级 二级 三
23、级 四级 五级 六级 七级级别数目申请专利数奖励个数优秀论文051015202530一级 二级 三级 四级 五级 六级 七级级别人数人数合计8 图 3 不同级别导师的招生人数 由上图可以明显看出,高级别导师报考的人数多,这与导师的影响力、知识水平、人际关系等多方面有关,但这种现象也会带来一系列的问题,例如某个专业报考过多,某个专业出现“冷门”现象。 图 4 不同级别导 师的到账经费 各个级别对到账经费的波动影响较大,并非呈简单的线性关系,这可能与导师所研究的项目、可操作程度等多方面的因素相关。 综上所述:高级别导师发表论文数、报考人数较低级别导师多,而三级、六级学生数量明显高于二级、五级导师,
24、这与大量学生选取高级别导师,导致跟随高级别导师学生数量过多,只能跟随较原本分数较低的导师学习。到帐经费,申请专利数不随着导师的岗位等级成规律性变化,因此可以说他们对岗位等级基本无影响。 6.3 问题三 研究生名额分配方案优化 根据问题二的分析,可以得出结论:以前的硕士研究生名额分配方案主要 参考导师岗位级别进行分配。但是,研究生分配名额有其特殊性,每个学科专业的招生名额要受到导师数量、学术水平、学科发展前景等大量因素的影响。 6.3.1 模型的分析 要对 2012 年的研究生名额进行预分配,首先应该预测出 2012 年该校招收研究生的总人数,然后再根据分配指标进行名额分配。由于高校每年的招生研究生人数变化率小,无偏 (1,1)GM 模型 对实际问题进行预测时,当原始数据序列增长率变化较小,即(1,1)GM 中的 a 较小时,预测精度较高;因此本文采用灰色 )1,1(GM 预测模型对 2012 年某高校招收研究生总数进行预测。 6.3.2 模型的建立 根据原始数据,建立时间序列: 020406080100120一级 二级 三级 四级 五级 六级 七级级别经费到账经费