1、 1 / 25 教师薪金模型分析 某地人事部门为研究中学教师的薪金与他们的资历、性别、教育程度及培训情况等因素之间的关系,要建立一个数学模型,分析人事策略的合理性,考察是否存在不合理、不公正的待遇,以及婚姻状况是否会影响收入。为此,从当地教师中随机选了 3414 位进行观察,然后从中保留了 90 个观察对象,得到了下表相关数据。 Z=月薪(元); X1=工作时间(月); X2=性别( 1 男, 0 女); X3=( 1 男性或单身女性, 0 已婚女性); X4=学历(数值越大学历越高); X5=受聘单位( 1 重点, 0 其他); X6=( 0 未受过培训的毕业生或肄业生, 1 受过培训的毕业
2、生) X7=( 1 已两年以上未从事教学工作, 0 其他) 问题: 1)薪金与他们的资历、性别、教育程度及培训情况等因素之间是否有关系,有则建立关系数学模型,通过你的模型分析人事策略的合理性,考察是否存在不合理、不公正的待遇,以及婚姻状况是否会影响收入等; 2)表中没有给出教师的职称信息,能否用数学建模方法对给出他们的大致职称信息; 3)如果要进行工资调整,设计一个相对公正、合理的工资体系,并用数据表中相关数据验证说明。 附数据表: 编号 Z X1 X2 X3 X4 X5 X6 X7 1 998 7 0 0 0 0 0 0 2 1015 14 1 1 0 0 0 0 3 1028 18 1 1
3、 0 1 0 0 4 1250 19 1 1 0 0 0 0 5 1028 19 0 1 0 1 0 0 6 1028 19 0 0 0 0 0 0 7 1018 27 0 0 0 0 0 1 8 1072 30 0 0 0 0 0 0 9 1290 30 1 1 0 0 0 0 10 1204 30 0 1 0 0 0 0 11 1352 31 0 1 2 0 1 0 12 1204 31 0 0 0 1 0 0 13 1104 38 0 0 0 0 0 0 14 1118 41 1 1 0 0 0 0 15 1127 42 0 0 0 0 0 0 16 1259 42 1 1 0 1 0
4、0 17 1127 42 1 1 0 0 0 0 18 1127 42 0 0 0 1 0 0 19 1095 47 0 0 0 0 0 1 20 1113 52 0 0 0 0 0 1 21 1462 52 0 1 2 0 1 0 2 / 25 22 1182 54 1 1 0 0 0 0 23 1404 54 0 0 0 1 0 0 24 1182 54 0 0 0 0 0 0 25 1594 55 1 1 2 1 1 0 26 1459 66 0 0 0 1 0 0 27 1237 67 1 1 0 1 0 0 28 1237 67 0 1 0 1 0 0 29 1496 75 0 1
5、0 0 0 0 30 1424 78 1 1 0 1 0 0 31 1424 79 0 1 0 0 0 0 32 1347 91 1 1 0 1 0 0 33 1343 92 0 0 0 0 0 1 34 1310 94 0 0 0 1 0 0 35 1814 103 0 0 2 1 1 0 36 1534 103 0 0 0 0 0 0 37 1430 103 1 1 0 0 0 0 38 1439 111 1 1 0 1 0 0 39 1946 114 1 1 3 1 1 0 40 2216 114 1 1 4 1 1 0 41 1834 114 1 1 4 1 1 1 42 1416 1
6、17 0 0 0 0 0 1 43 2052 139 1 1 0 1 0 0 44 2087 140 0 0 2 1 1 1 45 2264 154 0 0 2 1 1 1 46 2201 158 1 1 4 0 1 1 47 2992 159 1 1 5 1 1 1 48 1695 162 0 1 0 0 0 0 49 1792 167 1 1 0 1 0 0 50 1690 173 0 0 0 0 0 1 51 1827 174 0 0 0 0 0 1 52 2604 175 1 1 2 1 1 0 53 1720 199 0 1 0 0 0 0 54 1720 209 0 0 0 0 0
7、 0 55 2159 209 0 1 4 1 0 0 56 1852 210 0 1 0 0 0 0 57 2104 213 1 1 0 1 0 0 58 1852 220 0 0 0 0 0 1 59 1852 222 0 0 0 0 0 0 60 2210 222 1 1 0 0 0 0 61 2266 223 0 1 0 0 0 0 62 2027 223 1 1 0 0 0 0 63 1852 227 0 0 0 1 0 0 64 1852 232 0 0 0 0 0 1 3 / 25 65 1995 235 0 0 0 0 0 1 66 2616 245 1 1 3 1 1 0 67
8、 2324 253 1 1 0 1 0 0 68 1852 257 0 1 0 0 0 1 69 2054 260 0 0 0 0 0 0 70 2617 284 1 1 3 1 1 0 71 1948 287 1 1 0 0 0 0 72 1720 290 0 1 0 0 0 1 73 2604 308 1 1 2 1 1 0 74 1852 309 1 1 0 1 0 1 75 1942 319 0 0 0 1 0 0 76 2027 325 1 1 0 0 0 0 77 1942 326 1 1 0 1 0 0 78 1720 329 1 1 0 1 0 0 79 2048 337 0
9、0 0 0 0 0 80 2334 346 1 1 2 1 1 1 81 1720 355 0 0 0 0 0 1 82 1942 357 1 1 0 0 0 0 83 2117 380 1 1 0 0 0 1 84 2742 387 1 1 2 1 1 1 85 2740 403 1 1 2 1 1 1 86 1942 406 1 1 0 1 0 0 87 2266 437 0 1 0 0 0 0 88 2436 453 0 1 0 0 0 0 89 2067 458 0 1 0 0 0 0 90 2000 464 1 1 2 1 1 0 4 / 25 摘要 本文建立了中学教师的薪金与他们的
10、工作时间,性别,教育程度及培训情况等之间关系的统计回归模型 .针对题目要求,我们分析了各变量的特点 以及各个变量之间的联系,利用EXCEL, MATLAB 等软件,最终得到了最佳模型 .首先 ,我们通过题目所给的数据分析,用EXCEL软件得到散点图,我们发现 X1,X2,X3,X4,X5,X6,X7对薪金( Z)均呈线性关系 .因此,我们初步得到了一般的线性回归模型 如下: Z=C0+C1*X1+C2*X2+C3*X3+C4*X4+C5*X5+C6*X6+C7*X7+ (1) 利用 MATLAB 软件求解,我们得到了回归系数和置信区间等一系列的数据 .通过对得到的数据进行分析 .我们发现模型存
11、在缺陷 ,模型 从整体上来看效果也不是很好 .我们还可以看到有些变量的置信区间是经过零点的,因此 ,我们推测有些变量对薪金( Z )的影响是不显著的 .同时使用 EXCLE软件对每个要素与 薪金的线性分析发现 X1,X4,X6与薪金( Z) 的相 系数都在 0.5以上, 经过分析 ,我们最终涮选出对薪金( Z)影响显著的变量 X1 ,X4和 X6 .用残差分析法对模型进行分析 .尝试将它们的平方项或 开方项 加入到模型中,建立新的回归模型 .经多次尝试 ,我们最终建立了进一步改进的模型( 2)如下: Z=C0+C1*X1+C2*X6+C3*SQRT(X4)*X1+C4X12 + (2) 我们再
12、次通过 EXCEL软件回归分析得到 R2=0.87130588, F=143.8702088, P=5.45E-37通过与模型( 1)的比较,模型( 2)是一个简单易用的模型,模型可靠度更高,模型更加万善 .也说明教师的薪金与工作时间( x1) ,学历( x4),培训情况( X6) 有着密切关系,与性别和婚姻状况的差异关系并不显著 .全文模型的求解用图表与文字结合来说明,直观 ,易懂 。 关键词:回归分析 图形结合 残值分析法 一、问题的提出 某地人事部门 为研究中学教师的薪金与他们的资历 ,性别 ,教育程度及培训情况等因素之间的关系 .要建立一个数学模型 ,分析人事策略的合理性 .特别是考察
13、女教师是否收到不公正的待遇 ,以及她们的婚姻状况是否会影响收入 .为此 ,从当地教师中随机选了 3414位进行观察 ,然后从中保留了 90个观察对象 。 进行变量的选择 ,建立 x1.x7 的回归模型 说明 薪金与哪些变量的关系密切 .是否存在性别和婚姻状况上的差异 。 除了变量 X1 X7本身之外 ,尝试将他们的平方项和它们的 开方 项加入到模型中 ,建立更好的模型 。 二、 问题的分析 本文是一个关于建立教师 薪金影响因素的回归模型。对于问题 1 我们很难确定到底与哪些因素有关 ,所以 ,在模型中我们考虑到了题目给出的所有因素 ,通过题目给出的数据 ,我们做出了 想 X1 X7 的散点图
14、,发现这七个变量之间与因变量均呈线性关系 .因此 ,我们初步建立了一般的线性回归模型( 1) .然后 ,我们用 MATLAB 软件求解 ,通过对解出的数据进行分析 .5 / 25 我们发现模型存在缺陷 ,有些变量对因变量的影响不显著 .这也就说明了性别和婚姻状况上的差异与所调查的教师的薪金影响较小 。 为了模型得到进一步的改进 ,.我们剔除了其中对因变量影响不显著的变量 .然后 ,再用 对因变量影响显著的 X1,X4和 X6 建立了简单的线性回归模型 .求解之后发现模型依然没有达到理想的效果 .然后再利用残差分析法 ,在前一模型中增加了它们的 开方 项和平方项 .最终得到进一步改进的模型 (2
15、).然后再用 EXCEL软件对其 回归分析。 三、 模型的假设 为简单起见, 我们假设资历 (年) 和工作时间对薪金的作用是线性的 ,即资历每增加一年 ,薪金的增长是常数 ,工作时间的增长 ,薪金的增长也是常数 . 四 、 模型的建立与求解 基本模型 首先 ,我们把所有的相关变量都予以考虑 ,因变量薪金( Z) 与工作时间(月)X1;性别 X2;婚姻状况 X3;学历 X4;受聘单位 X5;培训情况 X6;资历 X7之间的多元线性回归模型为: Z=C0+C1*X1+C2*X2+C3*X3+C4*X4+C5*X5+C6*X6+C7*X7+ (1) 其中 C0,C1,C2,C3,C4,C5,C6,C
16、7是带估计的回归系数, 是随机误差。 利用 EXCEL的数据分析功能进行回归分析可以得到回归系数及其置信区间(置信水平 =0.05)、检验统计量 R2,F,结果。( EXCEL的回归分析结果见 表 1,检验统计量 R2,F,的结果见表 2) (表 1) 6 / 25 (表 2) 结果分析 从表 2, R2=0.794038851907838,即因变量薪金( Z)的 79.4可由模型确定,远小于,因而模型( 1)从整体来看是可用的。同时由上表 1可知从 C2,C3.C5,C6,C7的置信区间包含零点,说明模型( 1)存在缺点,回归变量 X2,X3, X5,X6,X7(对因变量 Z的影响 )不是太
17、显著,但由于 X6与 Z的相关分析的相关系数大于 0.5,我们仍将变量 X6保留在模型中,而将 X2,X3,X5,X7舍弃。 模型的改进 我们已将 X2,X3,X5,X7舍弃,保留 X1,X4,X6建立逐步线性回归方程,我们经过多次试验将他们的平方项与开方项加入其中,我们得到了较好的模型,得到如下方程: Z=C0+C1*X1+C2*X6+C3*SQRT(X4)*X1+C4*X12 + (2) 利用 EXCEL的数据分析功能进行回归分析可以得到回归系数及其置信区间(置信水平 =0.05)、检验统计量 R2,F,结果。( EXCEL的回归分析结果见表 3,检验统计量 R2,F,的结果见表 4) (
18、表 3) 7 / 25 (表 4) 在上述改进的模型中 ,通过数据我们可以看到 R2=0.871306明显地得到了提高 ,也就是说薪金Z的 87%均可由模型确定 . P 远小于 0.05,模型从整体上看是成立的 .,现在我们就来检验薪金的分配: Z=925.8696 +6.4958*X1+234.1001*X6+7.9301*SQRT(X4)*X1+-0.0094*X12 ( 2) 从上面看出是合理的 . 现在进行残差分析: 输入 X1; X6; SQRT(X4)*X1; X12;Z的数据后, 在 MATLAB中进行残差分析执行以下命令; (如附录一所示) X=ones(90,1) X1 X6
19、 SQRT(X4)*X1 X12; Y=Z; b,bint,r,rint,stats=regress(Y,X); rcoplot(r,rint) 我们可以得到残差分析 : (表 5) (表 5) 在残差图中我们可以看到 ,除 7个数据(在图中 用红色表示)外 ,其他数据的残差离零点均较近 ,且残差的置信区间都 不 包含零点 .这说明回归模型 。 8 / 25 Z=925.8696 +6.4958*X1+234.1001*X6+7.9301*SQRT(X4)*X1+-0.0094*X12 ( 2) 能较好地符合原始数据 .而个别异常点可以去掉 .说明模型( 2)比较合理,具有实用性。 通过我们所
20、建的模型,利用 EXCEL制图分析是否存在不合理,不公平的待遇,以及婚姻状况是否影响收入。 已婚的预期工资(系列 2)与实际工资(系列 1)的比较 通过 上图不难发现 在编号 14到编号 20数据差异较大,从而足以证明婚姻状况会影响收入,已婚的教师的收入会降低。 通过 EXCEL对男女教师的各项指标进行分析(如下表) 男女教师各项指标对比 一开始我们从表中大体观察发现男教师的工资较女教师高,以为存在性别歧视问题,但经过对男女教师的各项模型的指标分析如上图,最终发现男教师较女教师工资高并非偶然而是由多种因素决定的必然结果。所以 在性别方面不存在待遇的不公平。 问题二 模型建立 : 结合实际情况我
21、们对 中学教师职称评定 的标准进行假设,假设如表 所示: 学历 职称 工作时间(年) 专科(学历为 0) 初级教师 04 中学二级教师 415 中学一级教师 1530 高级教师 30 本科(学历为 2,3) 初级教师 02 中学二级教师 210 中学一级教师 1025 9 / 25 高级教师 25 硕士(学历为 4) 中学二级教师 05 中学一级教师 510 高级教师 10 博士(学历为 5) 中学一级教师 05 高级教师 5 模型求解 : 根据假设条件 通过 EXCEL 多重 条件函数求解可以 得到职称表如下: 编号 工资 工作时间(月) 学历 工作时间(年) 教师职称 1 998 7 0
22、0.583333333 初级教师 2 1015 14 0 1.166666667 初级教师 3 1028 18 0 1.5 初级教师 4 1250 19 0 1.583333333 初级教师 5 1028 19 0 1.583333333 初级教师 6 1028 19 0 1.583333333 初级教师 7 1018 27 0 2.25 初级教师 8 1072 30 0 2.5 初级教师 9 1290 30 0 2.5 初级教师 10 1204 30 0 2.5 初级教师 11 1352 31 2 2.583333333 二级教师 12 1028 19 0 1.583333333 初级教师
23、13 1018 27 0 2.25 初级教师 14 1118 41 0 3.416666667 初级教师 15 1127 42 0 3.5 初级教师 16 1259 42 0 3.5 初级教师 17 1127 42 0 3.5 初级教师 18 1127 42 0 3.5 初级教师 19 1095 47 0 3.916666667 初级教师 20 1113 52 0 4.333333333 二级教师 21 1462 52 2 4.333333333 二级教师 22 1182 54 0 4.5 二级教师 23 1404 54 0 4.5 二级教师 24 1182 54 0 4.5 二级教师 25
24、1594 55 2 4.583333333 二级教师 26 1459 66 0 5.5 二级教师 27 1237 67 0 5.583333333 二级教师 28 1237 67 0 5.583333333 二级教师 29 1496 75 0 6.25 二级教师 10 / 25 30 1424 78 0 6.5 二级教师 31 1424 79 0 6.583333333 二级教师 32 1347 91 0 7.583333333 二级教师 33 1343 92 0 7.666666667 二级教师 34 1310 94 0 7.833333333 二级教师 35 1814 103 2 8.58
25、3333333 二级教师 36 1534 103 0 8.583333333 二级教师 37 1430 103 0 8.583333333 二级教师 38 1439 111 0 9.25 二级教师 39 1946 114 3 9.5 二级教师 40 2216 114 4 9.5 一级教师 41 1834 114 4 9.5 一级教师 42 1416 117 0 9.75 二级教师 43 2052 139 0 11.58333333 一级教师 44 2087 140 2 11.66666667 一级教师 45 2264 154 2 12.83333333 一级教师 46 2201 158 4 1
26、3.16666667 高级教师 47 2992 159 5 13.25 高级教师 48 1695 162 0 13.5 一级教师 49 1792 167 0 13.91666667 一级教师 50 1690 173 0 14.41666667 一级教师 51 1827 174 0 14.5 一级教师 52 2604 175 2 14.58333333 一级教师 53 1720 199 0 16.58333333 一级教师 54 1720 209 0 17.41666667 一级教师 55 2159 209 4 17.41666667 高级教师 56 1852 210 0 17.5 一级教师 5
27、7 2104 213 0 17.75 一级教师 58 1852 220 0 18.33333333 一级教师 59 1852 222 0 18.5 一级教师 60 2210 222 0 18.5 一级教师 61 2266 223 0 18.58333333 一级教师 62 2027 223 0 18.58333333 一级教师 63 1852 227 0 18.91666667 一级教师 64 1852 232 0 19.33333333 一级教师 65 1995 235 0 19.58333333 一级教师 66 2616 245 3 20.41666667 高级教师 67 2324 253 0 21.08333333 一级教师