A题思路之一多元非线性回归分析.DOC

上传人:天*** 文档编号:901355 上传时间:2018-11-05 格式:DOC 页数:7 大小:132.50KB
下载 相关 举报
A题思路之一多元非线性回归分析.DOC_第1页
第1页 / 共7页
A题思路之一多元非线性回归分析.DOC_第2页
第2页 / 共7页
A题思路之一多元非线性回归分析.DOC_第3页
第3页 / 共7页
A题思路之一多元非线性回归分析.DOC_第4页
第4页 / 共7页
A题思路之一多元非线性回归分析.DOC_第5页
第5页 / 共7页
点击查看更多>>
资源描述

1、A 题思路之一多元非线性回归分析本题求解关键为建立工资与其他 7 个因素之间的关系模型,可以考虑采用回归分析法,也可以考虑其他方法;以下仅以回归分析法过程为例给出分析思路,仅供参考:注意:根据下述结果发现本问题应该考虑为多元非线性回归,因此请大家优先挑出使用非线性回归模型的论文,其余酌情考虑。1.数据预处理1)为数据分析方便,应该考虑名义变量或有序变量的量化处理(编码) ,如可以考虑如下编码方案(含符号约定):日平均工资的对数,便于回归分析;作为因变量。y;10x男 性女 性:工龄2;3男 性 或 单 身 女 性已 婚 女 性;40x 本 科1 硕 士( 受 教 育 状 况 ) 2 博 士3

2、博 士 后;5()0管 理 岗 位工 作 部 门 性 质 技 术 岗 位;61x受 过 培 训( 培 训 情 况 ) 未 受 过 培 训70两 年 以 上 未 从 事 一 线 工 作( 一 线 工 作 情 况 ) 其 它 情 况2)分别作出 y 与各自变量之间的散点图,发现与 x2 非线性关系较为明显(下图所示) ,所以应该考虑为非线性模型,data=xlsread(Adata.xls,2);y=data(:,1);x=data(:,2:8);plot(x(:,2),y,r*)title(lny vs x2)0 50 100 150 200 250 300 350 400 450 5003.4

3、3.63.844.24.44.64.85 lny vs x23)相关性分析data=xlsread(Adata.xls,2);y=data(:,1);x=data(:,2:8);s=corrcoef(data);xlswrite(coef.xls,s)lny X1 X2 X3 X4 X5 X6 X71 0.266995 0.775291 0.286135 0.505526 0.277929 0.199178 0.4897860.266995 1 0.160389 0.679446 0.312348 0.417621 -0.10498 0.3160250.775291 0.160389 1 0.

4、226096 0.103146 0.098854 0.151146 0.1563210.286135 0.679446 0.226096 1 0.266937 0.213363 -0.27966 0.2295350.505526 0.312348 0.103146 0.266937 1 0.412745 0.219762 0.8552360.277929 0.417621 0.098854 0.213363 0.412745 1 -0.05307 0.4233550.199178 -0.10498 0.151146 -0.27966 0.219762 -0.05307 1 0.2556650.

5、489786 0.316025 0.156321 0.229535 0.855236 0.423355 0.255665 1相关系数表也提示 y 仅与 x2,x4 关系密切.与婚姻状况 x1,x3 关系不明显.2、建模及简易求解(第 1、3 问)以下考虑分别用多元线性回归模型、线性逐步回归模型、非线性模型分析,从中选择相对最优的模型。1).多元线性回归结果源程序:data=xlsread(Adata.xls,2);Y=data(:,1);x=data(:,2:8);X=ones(90,1),x;b,bint,r,rint,stats=regress(Y,X);b,bint,stats结果:b(

6、系数) =3.6623 常数项0.0044 x10.0016 x2-0.0010 x30.1713 x40.0170 x5-0.0012 x60.0143 x7Bint(系数 95置信区间) = 3.5957 3.7289-0.0828 0.09170.0014 0.0019-0.0930 0.09100.0849 0.2577-0.0536 0.0876-0.0798 0.0773-0.1254 0.1540置信区间包含零点,可认为在 95置信度下,相应变量对 y 影响不显著,应该考虑改进模型。stats (统计量)=0.7852 (决定系数) 42.8304(F 值) 0 (P 值) 0.

7、0193关于异常值:利用上述多元线性回归模型分析结果,继续做异常点分析,rcoplot(r,rint)发现 5 个异常点: 43 52 60 61 9010 20 30 40 50 60 70 80 90-0.6-0.4-0.200.20.4Residual Case Order PlotResidualsCase Number从原始数据中将其剔除后,重新做多元线性回归,源程序:data=xlsread(Adata.xls,4);Y=data(:,1);x=data(:,2:8);X=ones(85,1),x;b,bint,r,rint,stats=regress(Y,X);b,bint,st

8、ats结果b =3.65020.00550.0017-0.02820.17520.0188-0.00760.0330bint =3.5949 3.7055-0.0688 0.07980.0015 0.0019-0.1056 0.04930.1026 0.2477-0.0406 0.0782-0.0739 0.0587-0.0880 0.1539stats =0.8526 63.6071 0 0.0132可见决定系数与 F 值均提高!2)线性逐步回归结果(考虑采用逐步回归方法)data=xlsread(Adata.xls,4);y=data(:,1);x=data(:,2:8);stepwise

9、(x,y);系数:beta =00.001700.1926000系数 95置信区间:betaci =0 00.0015 0.00190 00.1566 0.22870 00 00 0统计量stats = intercept: 3.6449(常数项)rmse: 0.1124rsq: 0.8495(决定系数)adjrsq: 0.8440fstat: 231.4507(F 值)pval: 0(P 值)较多元线性模型相比,尽管决定系数略有下降,但 F 值上升很快,逐步回归整体效果优于多元线性模型。3)多元非线性回归(含平方项、交叉项)模型:y=a+b*x2+c*x22+d*x4+e*x5*x6(仅为一

10、特例,考虑工资可能与 x5,x6 有一定的关系。另外其他组合较多,留给大家更多思考空间!)data=xlsread(Adata.xls,4);y=data(:,1);x=data(:,2:8);% rstool(x,y,quadratic)X=ones(85,1) x(:,2),x(:,2).2,x(:,4),x(:,5).*x(:,6);b,bint,r,rint,stats=regress(y,X);b,bint,statsb =3.52850.0038-0.000005050575980.16290.0300bint =3.4841 3.57300.0032 0.0043-0.00000

11、638020871 -0.000003720943260.1307 0.1950-0.0412 0.1011(包含零点)stats =0.9122(决定系数) 207.8439(F 值) 0 (P 值) 0.0075可见上述交叉项对 y 影响不够显著,考虑剔除。4)多元非线性回归(仅含平方项)模型:y=a+b*x2+c*x22+d*x4data=xlsread(Adata.xls,4);y=data(:,1);x=data(:,2:8);X=ones(85,1) x(:,2),x(:,2).2,x(:,4);b,bint,r,rint,stats=regress(y,X);b,bint,sta

12、ts结果:b =3.52820.0038-0.000004994975610.1691bint =3.4839 3.57260.0032 0.0043-0.00000631534196 -0.000003674609270.1406 0.1976stats =0.9115(决定系数) 277.9148(F 值) 0 (P 值) 0.0075本模型较带交叉项模型决定系数减小,但是系数 95置信区间均显示各变量对 y 影响显著,并且 F 大幅提升,因此最终选择模型如下: 22 43.5280.3.049.16yxx特别注意:本问题可能还有更加优秀的模型及结果!3、第二问关于女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入,可以从以下几个角度之一考虑:y 与 x3 相关系数;逐步回归结果中剔除了 x1 和 x3;也可采用单因素方差分析考虑。其他做法。*完!*

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 1

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。