1、职工工资模型摘要本文要求我们对某企业职工工资与其影响因素进行分析,并分析出影响工资的主要因素,同时判断女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入,最后要求我们对模型进行优化,得出实用性,可靠性较高的模型。问题一模型,我们分别建立了多元线性回归模型和多元非线性回归模型,通过 eviews 运行结果比较可知多元非线性模型具有较高的可行性,即工资一工龄之间为非线性关系。同时我们通过 SPSS 利用主成分分析法分析了工资的影响因素,得出了结论:影响工资的主要因素为工龄,学历,培训情况,一线经历。问题二模型,通过问题一的主成分分析,我们对问题一的模型进行了简化,剔除次要因素,使得模型更具有
2、实用性,也更便于数据较多时的计算。而后对女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入进行了判断,得出结论:该企业女性职工并未受到不公平待遇且女性职工的婚姻状况不影响其收入。问题三模型,我们采用逐步回归分析法,对问题一的模型中的解释变量逐个引入,通过检验是否合格来筛选解释变量,因此,该模型具有很高的可靠性。最后对模型进行了误差分析,可知模型四具有较高的可行性,最后我们得出结论:工龄和学历是影响该企业职工工资的关键因素。模型平均误差如下表:模型一 模型二 模型三 模型四平均误差 5.87982343 4.55709 4.5866 4.367151结论 1、影响工资的主要因素为工龄,学历
3、,培训情况,一线经历。2、该企业女性职工并未受到不公平待遇且女性职工的婚姻状况不影响其收入。3、工龄和学历是影响该企业职工工资的关键因素。关键词:多元线性回归 多元非线性回归 eviews 主成分分析 SPSS 逐步回归分析法- 0 -一、问题重述1.1 问题描述职工工资可以说是人们最为关切、议论最多的部分,因此也常常是最受重视的部分。一般说来,现代企业的工资具有补偿职能、激励职能、调节职能、效益职能。科学合理的工资制度,是激励职工的劳动积极性,提高劳动效率的重要手段,正确运用工资的杠杆作用在调动员工积极性方面会起到事半功倍的效果。此外,对于企业中的各种不同的“特殊职务族” ,是否要制定和执行
4、专门的倾斜与优惠政策,如对管理干部、高级专家、女工等,也是需要重点考虑的问题。现随机抽取了某企业若干职工的相关数据,见附件 Bdata.xls。请建立适当的数学模型研究下列问题:1.2 问题提出(1)分析平均日工资与其他因素之间的关系,尤其需要说明与哪些因素关系密切;(2)考察女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入;(3)继续改进你的模型,并给出模型误差分析。二 问题分析本题要求我们分析企业员工的平均日工资与其他影响因素之间的关系,同时指出哪些因素对平均日工资影响较大。我们先建立简单的多元线性回归模型,对日工资与各因素之间的关系进行粗略的分析,因考虑到工龄达到一定程度后,工龄
5、再增大对模型的结果影响不大,故建立了多元非线性回归模型,拟合平均日工资。 。用主成分分析法 1对各个因素进行分析,并找出对日工资影响较大的几个。接着,我们剔除对模型结果影响较小的因素,保留主要因素使模型得到简化,这样更易于计算也更符合实际。最后我们利用逐步回归法 2对问题一的模型进行改进,剔除对工资影响较小的因素,使得模型得到优化。三、模型假设因素1、本题所给数据能确实反映出该公司的工资的构成2、所给数据有较高的可靠性及准确性3、男性和女性的工资数据在相同条件下获得4、男性不管是否已婚等同于女性已婚四、主要符号说明- 1 -12:0:1yx平 均 日 工 资工 龄 ( 月 ) 无 一 线 经
6、历( 一 线 经 历 ) =有 一 线 经 历3:x未 培 训( 培 训 ) 受 过 培 训40:1技 术 岗 位( 岗 位 ) =管 理 岗 位5:0x男 性( 性 别 ) 女 性6:女 性 未 婚( 婚 姻 ) =1男 性 或 女 性 已 婚780x表 示 学 历 为 本 科781x表 示 学 历 为 硕 士780表 示 学 历 为 博 士781x表 示 学 历 为 博 士 后这里仅给出主要符号说明,其余符号在文中会一一说明五、问题一模型的建立与求解5.1 多元线性回归模型的建立与求解5.1.1 多元线性回归模型建立 首先对题目所给数据进行量化,量化结果见附录附表一假设该企业员工工资与其影
7、响因素满足多元线性关系,且各因素没有相互影响,由此建立多元线性回归模型,得: 123456782()*(3)(4)*()6*(7)(8)*(9)0,iycxcxcxcxc- 2 -(5-1 )其中 C(1)、C(2)、C(3)、C(4) 、C(5)、C(6)、C(7)、C(8)、C(9)是待回归系数参量, 是满足正态分布的随机误差。5.1.2 模型求解利用 eviews 软件 3对模型中工资与各个影响因素进行回归分析得如下结果表一Dependent Variable: YMethod: Least SquaresDate: 08/18/28 Time: 16:18Sample: 1 90Inc
8、luded observations: 90Y=C(1)+C(2)*X1+C(3)*X2+C(4)*X3+C(5)*X4+C(6)*X5+C(7)*X6+C(8)*X7+C(9)*X8Coefficient Std. Error t-Statistic Prob. C(1) 37.14526 2.325447 15.97338 0.0000C(2) 0.087893 0.006701 13.11734 0.0000C(3) -0.156203 2.239736 -0.069742 0.9446C(4) -4.925091 6.531140 -0.754094 0.4530C(5) 1.2182
9、69 2.045119 0.595696 0.5530C(6) 1.608884 2.617405 0.614686 0.5405C(7) 0.981923 2.701711 0.363445 0.7172C(8) 24.63417 5.789966 4.254631 0.0001C(9) 17.13245 6.680527 2.564536 0.0122R-squared 0.796310 Mean dependent var 57.63333Adjusted R-squared 0.776193 S.D. dependent var 16.23594S.E. of regression 7
10、.680945 Akaike info criterion 7.010002Sum squared resid 4778.750 Schwarz criterion 7.259983Log likelihood -306.4501 Durbin-Watson stat 1.066961由此可得出各待定系数的值如下表:表二参量 参量估计C(1) 37.14526C(2) 0.087893C(3) -0.156203C(4) -4.925091C(5) 1.218269C(6) 1.608884- 3 -C(7) 0.981923C(8) 24.63417C(9) 17.13245将结果带入模型得
11、 12345(13.74)(0.6974) (0.596)(0.7549) (0.6148)6 8(0.345)(.2563)(.536)27.89*1*28*9TyxxxxxR .RDW(5-2 )5.1.3 结论与检验5.1.3.1 对模型的检验相关系数检验法在模型中,相关系数的计算公式为:(5-3 )2121()()niiniiyr此公式反映出了 X 与 Y 线性度的一个度量指标,其中 r 范围为(0,1) ,r越接近 1,则 X 与 Y 线性度越高。由相关系数检验法计算得到r=0.8924可见 r 并不接近 1,线性相关度并不高,因此,该企业职工工资与个因素之间并不是线性关系。- 4
12、-图一通过 eviews 得到实际值、拟合值、残差的走势图,从图中可以看出 拟合值与实际值存在较大误差,因此该模型需要进一步的改进5.3.1.2 结论该模型中,本文建立了多元线性回归模型,简单的给出了该企业工资与影响因素之间的关系。由于考虑到工龄增加到一定程度后继续增加对模型的影响较小,同时该模型优化拟合度只有 0.8924,故该模型并不可靠,我们需要引入非线性量对模型进行改进。5.2 多元非线性回归模型的建立与求解5.2.1 模型建立考虑到工龄增加到一定程度后继续增加,对工资的影响程度较小,因此建立工资关于各因素的多元非线性模型:(5-4)1234567812()*(3)(4)*(5)(6)
13、*(7) 8900,iycxcxcxc其中 C(1)、C(2)、C(3)、C(4) 、C(5)、C(6)、C(7)、C(8)、C(9)、C(10)是待回归系数参量, 是满足正态分布的随即误差。5.2.2 模型求解利用 eviews 软件对模型中工资与各个影响因素进行回归分析得如下结果表三Dependent Variable: Y- 5 -Method: Least SquaresDate: 08/18/28 Time: 17:58Sample: 1 90Included observations: 90Y=C(1)+C(2)*X1+C(3)*X2+C(4)*X3+C(5)*X4+C(6)*X5
14、+C(7)*X6+C(8)*X7+C(9)*X8+C(10)*X12Coefficient Std. Error t-Statistic Prob. C(1) 29.69142 2.081745 14.26275 0.0000C(2) 0.222376 0.019167 11.60186 0.0000C(3) -2.458851 1.775009 -1.385261 0.1698C(4) -2.773818 5.101962 -0.543677 0.5882C(5) -0.436665 1.610987 -0.271054 0.7870C(6) 1.932692 2.041714 0.9466
15、03 0.3467C(7) 0.841216 2.107066 0.399236 0.6908C(8) 19.61945 4.567470 4.295474 0.0000C(9) 17.80518 5.210745 3.417012 0.0010C(10) -0.000320 4.39E-05 -7.292542 0.0000R-squared 0.877646 Mean dependent var 57.63333Adjusted R-squared 0.863882 S.D. dependent var 16.23594S.E. of regression 5.990123 Akaike
16、info criterion 6.522540Sum squared resid 2870.526 Schwarz criterion 6.800297Log likelihood -283.5143 Durbin-Watson stat 1.583030算法同模型一,由此可得出各系数的值如下表:表四参量 参量估计C(1) 29.69142C(2) 0.222376C(3) -2.458851C(4) -2.773818C(5) -0.436665C(6) 1.932692C(7) 0.841216C(8) 19.61945C(9) 17.80518C(10) -0.000320将结果带入模型
17、,得到该公司员工工资与影响因素之间的关系为:- 6 -12345(1.608)(.38561) (0.2715)(0.5467) (0.9463)78(0.392)(4.295)(.47).64*6*2*8Tyxxxxx (.954)27 1RRDW(5-5 )5.2.3 结论与检验5.2.3.1 模型的检验检验方法同模型一本模型中 r=0.9368,接近 1,因此本模型满足非线性关系,比模型一更实际,应用范围也更广,具有比较高的运用价值。图二同样我们通过 eviews 得到实际值、拟合值、残差的走势图,从图中可以看出,模型的拟合优度值比较高,样本的拟合值与实际值基本吻合,模型具有较高的实用价
18、值。5.2.3.2 结论我们建立了多元非线性回归模型,给出了该企业员工的工资与其影响因素的非线性关系。由于考虑到了工龄增加到一定程度后继续增加对模型的影响较小,使得模型的拟合优度达到了 0.8639,因此模型二更具有实际应用价值和可靠性。5.3 企业职工工资影响因素主成分分析5.3.1 下表给出了影响该企业职工工资的 8 项变量指标。 (详见附录 附- 7 -表一)其中 x1 表示职工工龄(月) ,x 2表示职工是否有过一线工作经历,x3表示是否接受过培训,x 4表示工作性质,x5表示职工性别, x 6表示职工婚姻状况,x7、x 8联合表示职工学历情况表五序号 x1 x2 x3 x4 x5 x
19、6 x7 x81 7 0 0 0 0 1 0 02 14 0 0 0 1 1 0 03 18 0 0 1 1 1 0 0 85 403 1 1 1 1 1 0 190 464 0 1 1 1 1 0 1将表中的原始数据按公式(5-6 )做标准化处理,然后将它们代入相关系数公式计算,得到相关系数矩阵表六X1 X2 X3 X4 X5 X6 X7 X8X1 1.000000 0.151146 0.156321 0.098854 0.160389 0.009829 0.005996 0.180312X2 0.151146 1.000000 0.255665 -0.053068 -0.104982 0.
20、254374 0.094888 0.255223X3 0.156321 0.255665 1.000000 0.423355 0.316025 0.095618 0.490436 0.802955X4 0.098854 -0.053068 0.423355 1.000000 0.417621 0.229484 0.263066 0.346091X5 0.160389 -0.104982 0.316025 0.417621 1.000000 0.409081 0.263066 0.161418X6 0.009829 0.254374 0.095618 0.229484 0.409081 1.00
21、0000 0.034922 0.027420X7 0.005996 0.094888 0.490436 0.263066 0.263066 0.034922 1.000000 -0.026333X8 0.180312 0.255223 0.802955 0.346091 0.161418 0.027420 -0.026333 1.000000通过 SPSS 软件 4由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率5.3.2表七初始特征值 提取平方和载入成份合计 方差的 % 累积 % 合计 方差的 % 累积 %1 2.674 33.428 33.428 2.674 33.428 33
22、.428ijjijjjxmM1ainjijx- 8 -2 1.350 16.876 50.304 1.350 16.876 50.3043 1.149 14.357 64.661 1.149 14.357 64.6614 1.013 12.669 77.330 1.013 12.669 77.3305 .897 11.213 88.543 .897 11.213 88.5436 .542 6.781 95.3247 .330 4.123 99.4488 .044 .552 100.000提取方法:主成份分析。由此得到各个成分的贡献率与累计贡献率表八影响因素 原变量 成份 特征值 贡献率% 累积
23、贡献率%工龄(月) x1 1 2.674 33.428 33.428x7 2 1.350 16.876 50.304学历x8 3 1.149 14.357 64.661培训情况 X3 5 1.013 12.669 77.330一线经历 X2 6 .897 11.213 88.543性别 X5 7 .542 6.781 95.324婚姻状况 X6 4 .330 4.123 99.448工作性质 X4 8 .044 .552 100.000结果分析由分析结果可得知在所有影响职工工资的因素中,工龄,学历,培训情况,一线经历对职工的工资影响比较大,尤其是工龄以及学历对工资的影响较大。六、问题二模型建立与求解6.1 问题分析通过问题一的 5.3 的分析可以得出,影响该企业职工的工资的主要因素为工龄,学历,培训情况,一线经历。因而我们在建立模型的时候可以排除次要因素的影响,使模型简化而更易于实际操作。6.2 模型的建立通过对之前的主成分分析,我们剔除了对模型结果影响不大的工作性质,性别,婚姻状况几个因素,对模型进行了简单化处理,使得模型更加简易。由