1、数学建模论文论文类别:A 题论文题目:评阅试卷算法建模参赛队员:学号、姓名、联系电话队员一: 队员二:10507010212 赖 伟 13500347194队员三: 评阅试卷算法建模摘要:本文主要研究了,在论文评审中,由于聘请的评委用于评卷的时间有限,评审费用也是竞赛组委会必须考虑的问题。面对大量的参赛论文,竞赛组委会在既要保证论文评分的公平又要兼顾评委时间及费用的前提下,常采用尽量保证论文评分公平的折中方法来对论文评分。对怎样避免人员不同带来的差异以及怎样在保质保量的情况下来折合分数或校正分数,在对所给数据的进行分析后来建立数学模型,建立科学合理评阅试卷的方法。我们给出三种计算总分的方法分别
2、为:求平均值法,去掉阅卷人不同带来的差异法,加权系数法,然后从公平合理的角度分析比较这三种方法的优劣。根据所给数据利用查询法统计 A、B 卷每位老师各自的工作量,并且分别A、B 评阅方法的误判的概率,通过比较误判的概率和工作量来分析两种方法的优劣。我们通过估计法来估计评阅方法在第一轮时有多少被去掉。最后,我们根据上述方法二 ,提出一个阅卷方案,在公平合理、保质保量的前提下,使20 位阅卷人在 3 天时间内评阅 630 份答卷以及在此之上评阅 2000 份需要多少评卷人。我们采用 matlab 和 lingo 软件编程得到 A、B 评阅方法的误判的概率分别为:A 题误判的概率:Pa=4.9171
3、19604038%B 题误判的概率:Pb= 1.938945837024%20 位阅卷人在 3 天时间内评阅 630 份答卷需要随机抽取x1=30 份试卷由所有的评阅人评阅,剩下的 600 份试卷由随机的 x2=2 位老师评阅,评阅 2000 份至少需要最少请 45 个评阅人才能保证保质保量在三天内完成评阅 2000 份试卷。关键词:matlab 编程 误差分析 数据处理 加权校正 评阅试卷算法 如何建模 LINGO 编程等一、问题综述A 题 评阅试卷竞赛论文评分问题在一些科技活动的竞赛中(如全国大学生数学建模竞赛等),参加竞赛者是通过提交论文来完成竞赛的。然后,评委对所有提交的论文进行打分,
4、竞赛组委会再通过这些论文的分数来确定参赛者的获奖等级。在论文评审中,由于聘请的评委通常科研和教学活动繁忙,使得他们能用于评卷的时间有限,此外,给评委的评审费用也是竞赛组委会必须考虑的问题。面对大量的参赛论文,竞赛组委会在既要保证论文评分的公平又要兼顾评委时间及费用的前提下,常采用尽量保证论文评分公平的折中方法来对论文评分。如在某地的数学模型竞赛有两份试题。A 题有 380 份答卷,由 13 位评阅人组成的小组来完成评阅任务;B 题有 250 份答卷,由 8 位评阅人组成的小组来完成评阅任务。理想的方法是每位评阅人看所有的试卷,并将他们排序,但这种工作量太大。另一种方法是进行一系列的筛选,在一次
5、筛选中,每位评阅人只看一定数量的答卷,并给出分数。评阅人的任务是从中选出 1/3 的优胜者。每份试卷最多评阅 3 次。试卷满分为 100 分。A 题,第一轮,每份试卷由两位评阅人随机抽取评阅。当两位评阅人给分相近时,将两个评阅成绩累加作为该答卷的总分;当两位评阅人给分相差大于一定值时,经第二轮,随机地请第三位阅卷人评阅,从三个评阅成绩中取两个相近的分数之和作为该答卷的总分。最后按这样得到的总分排序。因为只要选出 1/3 的优胜者,为了减少工作量,所以在第一轮之后,对前两位评阅人给分之和排在后 40%的答卷不再进入第二轮处理。B 题,每份试卷由三位评阅人随机抽取评阅,评阅人均不重复,将三个评阅成
6、绩累加作为该卷的总分排序。题目中的数据是一次竞赛评卷后的实际统计数据。请利用所给的数据完成下面的工作:(1)对 A 题和 B 题,分别给出 3 种计算总分的方法,比较其优劣。(2)分别计算 A 题和 B 题评阅人的工作量;并分别计算 A 题和 B 题评阅方法造成误判的概率,分析两种评阅方法的优缺点,哪一种评卷方法在哪方面更好。(3)对 A 题,在第一轮评阅轮后,你认为可以去掉多少试卷后,再进行第二轮的评阅。说明你的理由。(4)在现有条件下,20 位阅卷人在 3 天时间内评阅 630 份答卷,你们能否提供一个阅卷方法实现公平合理、保质保量的原则。(5)如果论文总数不小于 2000 份,最少应该聘
7、请多少名专家?数据见附件二、问题分析2.1 分析:(1) 由于对同一份答卷不同的老师会给出不同的分数,每一份试卷是由随机的两到三位老师评阅的,每一份试卷的得分基础是不同的,因此存在不同的计算总分的方法,这些方法各有优劣。(2) 评阅人的工作量可以由老师评阅的试卷份数来表示。理想的评阅方法是每位老师改所有的试卷,而题中所给方法只是每份试卷由随机的两到三位老师评阅,这样的评阅方法得到的分数和理想的方法得到的分数存在差距,这就造成了误判。(3)因为只要选出 1/3 的优胜者,为了减少工作量,所以在第一轮之后,对前两位评阅人给分之和排在后 40%的答卷不再进入第二轮处理,所以可以采用估计法。(4) 在
8、评阅人人数、时间给定的情况下,设计一种使每份试卷得分基础相同的评阅方法,实现公平合理、保质保量的原则。2.2 假设:1.每个老师标准公平地评阅每一份试卷.2.每一份试卷的评阅人是随机的。3.假设如果校正之后的分数大于 100 分则将他的的分考虑成 100 分4.每位评阅人给分的期望值反映了各自的评判标准。5.理想的分数值位于 0 到 100 之间。6.评阅人对所阅参赛作品均细致阅读,认真评分,不受外界活情绪的影响。7.每个人所给分数近似服从正态分布8.所给数据均有效 9.假设论文总数为 2000 份,时间同样三天。10. 假定每个老师每天评阅的最大试卷数为 30 份。2.3 符号说明: ess
9、a(i)对应于第 i 位评阅 A 卷的评阅人的平均误差essb(i)对应于第 i 位评阅 B 卷的评阅人的平均误差quana(i)第 i 位评阅 A 卷的评阅人的权系数quanb(i) 第 i 位评阅 B 卷的评阅人的权系数A 题:第 i 位老师给分的期望: aE所有老师给分的期望:第 i 位老师的差异因子 )(i误判的概率为:PaB 题:第 i 位老师给分的期望: b(i)E所有老师给分的期望:第 i 位老师的差异因子 )(i误判的概率为:Pbx1:从 630 份试卷中随机抽取 x1 份试卷x2: 630-x1 份由 x2 位评阅人来评阅x01:总共需要的人数x02:随机抽取的试卷数x03:
10、剩下的 2000-x02 由 x03 位评阅人评阅三、模型假设、建立与求解(一) 模型建立:问题一:三种计算总分的方法方法一:求均值法A 题:由三位阅卷人评阅的试卷时,实际分数= 2和分 数 相 近 的 两 个 成 绩 之由两位阅卷人评阅的试卷时,实际分数=每 位 阅 卷 人 给 出 的 分 数并将分数从高到低进行排序。B 题: 由三个阅卷人评阅的试卷,分数= 3每 位 阅 卷 人 给 出 的 分 数给出数据中有一份只有两位老师评阅,分数= 2每 位 阅 卷 人 给 出 的 分 数并将分数从高到低进行排序。方法二:去掉阅卷人不同带来的差异法A 题: i 位老师给分的期望:a()Eii第 个 老
11、 师 所 改 的 所 有 试 卷 分 数 的 总 和第 个 老 师 改 卷 的 总 数 13i所有老师给分的期望:aE13i=()差异因子: a()Eii13i(2)求实际所给分数由三位老师评阅的试卷: 2分 数 相 近 的 两 个 成 绩 分 别 乘 以 差 异 因 子分 数由两位老师评阅的试卷: *( 每 个 分 数 相 应 的 差 异 因 子 )分 数并将分数从高到低进行排序。B 题: i 位老师给分的期望:b()Eii第 个 老 师 所 改 的 所 有 试 卷 分 数 的 总 和第 个 老 师 改 卷 的 总 数 8i113i=()88i1差异因子: b()Eiii(2)求实际分数22
12、9 38 50 当三位老师评阅的试卷: *3( 每 个 分 数 相 应 的 差 异 因 子 )分 数给出数据中有一极端值(只有两位老师评阅) ,2( 每 个 分 数 相 应 的 差 异 因 子 )分 数并将分数从高到低进行排序。方法三:加权系数法根据裁判一直以来的评卷风格,分别给每个评阅人考虑权系数 ess。假设评委评卷的分数基本上服从正态分布,正态分布的分布密度函数为 f( )与分布函数 F( )为f( )= F( )= 式中, )2/(1ede)2/(21为标准差(或称方均根误差);e 为自然对数的底,其值为 2.7182它的数学期望为 E= =0 它的方差为 其平均误差为 df)( df
13、)(22=0.7979 0.8 此外由 =1/2 得 f)(f)(3/26745.0A 题:权系数 quana(i)= (10 的次数.利用 MATLAB 编程:见附表七运行得:A 题工作量序号 甲 乙 丙 丁 戊 己 庚 辛A 题工作量 61 66 61 60 74 61 72 48序号 壬 癸 甲甲 乙乙 丙丙A 题工作量 62 70 70 102 96B 题工作量序号 甲 乙 丙 丁 戊 己 庚 辛工作量 90 85 83 83 89 89 87 862.2 计算误判的概率 (以方法二的值来计算)1)计算误判的概率由三个评阅人评阅的试卷,从三个评阅成绩中取两个相近的分数之和取平均作为该答
14、卷的总分,由两个评阅人评阅的试卷,两个评阅成绩直接相加取平均作为该答卷的总分。这样得到的第 j 份试卷的分数是 fenshu1 (j)。该题误判的概率为:Pa % (1j380)380/)(1jAfenshu由三个评阅人评阅的试卷,三个评阅成绩之和取平均作为该答卷的总分,数据中的极端值(由两个评阅人评阅的试卷) ,则两个评阅成绩直接相加取平均作为该答卷的分数。这样得到的第 j 份试卷的分数是 B0(j)。该题误判的概率为:Pb % (1j231)231/)(0jB2.)结果A 题误判的概率: Pa=4.917119604038%B 题误判的概率:Pb= 1.938945837024%分析优缺点
15、由于 Pa Pb 则 A 评卷方式比 B 评卷方式的误判率要高,但工作量要小一些。3).程序见附表八问题三: 对 A 题,在第一轮评阅轮后,你认为可以去掉多少试卷后,再进行第二轮的评阅。说明你的理由。因为只要选出 1/3 的优胜者,为了减少工作量,所以在第一轮之后,对前两位评阅人给分之和排在后 40%的答卷不再进入第二轮处理。所以至少可以去掉 40%但是必须小于等于 60%问题四: 在现有条件下,20 位阅卷人在 3 天时间内评阅 630 份答卷,你们能否提供一个阅卷方法实现公平合理、保质保量的原则.1. 阅卷方法:(我们考虑用方法 2 去掉差异法)从 630 份试卷中随机抽取 x1 份试卷,
16、每一份由所有的评阅人评阅,得到i 位老师给分的期望: a(i)Ei第 个 老 师 所 改 的 所 有 试 卷 分 数 的 总 和第 个 老 师 改 卷 的 总 数20i1所有老师给分的期望: aE13i=()20)(201iEa差异因子: a()ii20i1把 630 份试卷从 1 号编到 630 号 ,前已被打分的试卷的分数相应的乘以其相应的差异因子,后 630-x1 份由 x2 位评阅人来评阅.方法如下:试卷计算得分:p(j)=编号为 j 的试卷被第 i 位评阅人打分* )(ia如果 ,就取 。20i110)(jp10)(p在利用 MATLAB 编程对 630 份试卷的得分 p(i)做一个从高到低的排列,得到排名。2. 最佳的 x1、x2 的求解整数非线性规划。假定每个老师每天评阅的最大试卷数为 30 份。最佳的 x1、x2 应该使得在限定的工作量条件下老师的总工作量达到最大,据此我们得到以下方程组:Max=20x1+(630-x1)x2