方差分析本科毕业论文.doc

上传人:坚持 文档编号:3653252 上传时间:2019-07-03 格式:DOC 页数:12 大小:1.29MB
下载 相关 举报
方差分析本科毕业论文.doc_第1页
第1页 / 共12页
方差分析本科毕业论文.doc_第2页
第2页 / 共12页
方差分析本科毕业论文.doc_第3页
第3页 / 共12页
方差分析本科毕业论文.doc_第4页
第4页 / 共12页
方差分析本科毕业论文.doc_第5页
第5页 / 共12页
点击查看更多>>
资源描述

1、第 0 页 本科学生毕业论文方差分析作 者 院 (系) 专 业 年 级 学 号 指导老师 日 期 第 1 页 方差分析 摘 要:方差分析是从观察变量的方差入手,研究诸多控制变量中哪些变量是 对 观 测 变 量 有 显 著 影 响的 变 量 .本 文 根据不同需要把某变量方差分解为不同的部分,比较它们之间的大小并用 检验进行显F著性检验的方法,并且用 excel 解决了一些问题.关键词:单因素方差分析;双因素方差分析;组间方差;组内方差; 统计量F1 方差分析问题的提出假设检验主要是检验两总体的均值是否差异显著,对于多个总体均值是否差异显著的问题,如果按照每一对总体进行一次检验,显然要花费很多时

2、间,而方差分析能一次性地检验多个总体均值是否存在显著差异.因此,方差分析所提供的处理方法比两两比较的处理方法要方便很多. 例 1:取一批由同种原料织成的布,用不同的染整工艺进行缩水实验,以考察不同的染整工艺对布的缩水率有无显著影响,进而可以寻找出缩水率较小的染整工艺.现有 五种不同的工艺,在每一工1A5艺下重复处理四块布,测得其缩水率数据如下表所示,试问五种不同的染整工艺的平均缩水率有无显著差异?表 1 染整工艺 缩水率1A4.3 6.8 5.2 6.526.1 6.3 4.2 4.136.5 8.3 8.6 8.249.3 8.7 7.2 10.15A9.5 8.8 11.4 8.9例 2:

3、在饲料养鸡增肥的研究中,某研究所提出三种饲料配方: 是以鱼粉为主的饲料 是以槐树粉1A2A为主的饲料, 是以苜蓿粉为主的饲料.为比较三种饲料的效果,特选 24 只相似的雏鸡随机均分为三组,3每组各喂一种饲料,60 天后观察它们的重量,试验结果如下所示:表 2饲料 鸡重/g1A1073 1009 1060 1001 1002 1012 1009 102821107 1092 990 1109 1090 1074 1122 100131093 1029 1080 1021 1022 1032 1029 10482 基本概念指标:衡量试验条件好坏的变量称为指标,用 y 表示,它是一个随机变量.在例

4、1 中,缩水率就是试验指标.因子:在试验中影响指标 y 的因素称为因子,它们常用大写字母 、 、 等来表示.在例 1 中ABC染整工艺对指标缩水率有影响,因此染整工艺就是因子,记为第 2 页 水平:在试验中因子所处的状态称为因子的水平,用表示因子的字母加下标来表示,譬如因子 的水平用 等来表示.在例 1 中有五种染整工艺,这便是染整工艺这一因子五个水平,A12,分别记为 123,45试验条件(也称处理):在单因子试验中,每个水平就是一个处理,在多因子试验中,每个因子取一个特定的水平,这些特定水平的组合称其为一个试验条件,又称为一个处理.3 基本假定从最简单的单因子试验问题着手,介绍在方差分析中

5、所作的假定.假定因子 有个 水平,记为Ar在水平下指标值的全体便构成一个总体,共有 个总体.我们有如下假定:12,rA r(1)假定第 个总体服从正态分布,其均值为 , i i(2)每一总体的方差相等,记为 ; 2(3)从第 个总体获得一个容量为 的样本为 ,且这 个样本相立. m12,.,12,.iimyr在上述三个假定下,比较各个总体的均值是否相同的问题,即要检验如下假设不全相等,检验这一对假设的统计方法便是方差分析.当拒绝01212:.,:,rrHH时,表示不同水平下的指标的均值有显著差异,此时称 因子是显著的,否则称因子不显著. A4 统计模型按假定有 ,因此可以认为观察值 与其均值

6、的差是随机误差 ,从而 有2(,)ijiyNijyiijijy如下数据结构式: 由 及 各个相互独立,可1,.,2,.ijijrjm2(,)ijiNijy知各 相互独立,且都服从 .因此可以给出如下的单因子方差分析统计的模型: ij2(0)2,1,.,()ijijijyrj各 相 互 独 立 同 分 布 于 N在该模型下检验的假设是: ,为了推广到两因子及0112H:.,:,.rrH不 全 相 等多因子方差分析方便起见,引入一般平均与效应的概念,如记各均值 的平均为: 称为i 1ri=一般平均,或称为总平均,又记 它表示从水平 的均值中除去总均值后特,.iiaiA有的贡献,称 为水平 的效应,

7、它可正可负,容易看出,诸 受到约束: 这样一来,iaiAia10ria统计模型可改写为, 1 2,1,.,.0N(0,)ijijriijyrjm各 相 互 独 立 同 分 布 于在该模型下检验的假设可以改写为: 0112:.,:,.r rHaHa不 全 为 05 基本思想5.1 平方和分解众所周知, 各数据的差异程度(即波动大小)可用它们的总偏差平方和(简称总平方和)nrm去度量: , 其中 为自由度.引起数据波动的原因不外有如下两个:TS21Tijijy1TfnTf(1)由于因子的不同水平引起的,当原假设不真时,各个水平下指标的均值(简称水平均值)不同,诸 样本均值间的差异程度可用如下的偏差

8、平方和去 度量:2,.ry AS第 3 页 这里乘以 是为每个水平进行了 次试验.这个平方和称为组间偏差平21,1rAAiiSmyfrmm方和,又称为因子 偏差平方和,简称因子 平方和.A(2)由于试验存在随机误差,即使在同一水平下获得的数据也会有差异,这是除因子 水平外的一A切原因引起的,我们将它们归结为随机误差,可以用组内偏差平方和(也称为误差平方和) 表示:eS由于 考虑到交叉21,1rAAiiSyfr2 211 ,rmrmTij ijiiij ijSyyy乘积项之和为 0,故有如下总平方和分解式: 22221111rmr r rTij ij eAi i i iij ij ij i S

9、5.2 均方(平均偏差平方和)与 比F偏差平方和 Q 的大小与数据个数(自由度)有关,一般说来,数据越多,其偏差平方和越大.为了便于在偏差平方和间进行比较,统计上引入了均方和的概念,它定义为, 其意为平均每/QMSf个自由度上有多少平方和,它比较好地度量了一组数据的离散程度.如今要对因子平方和与误差平方和之间进行比较,用其均方和 进行比较更为合理,因为均方和排除了自由/,/AeeMSfSf度不同产生的干扰.故用 作为检验的统计量.如果 ,则认为因子AeeF1,()aAeFf显著;若 ,则说明因子 不显著.经过简单推导,可以给出常用的各偏差平方和的A1,()aAf计算公式如下:.2211,rmr

10、TijAeTei iSySTSnn6 单因子方差分析设在一个试验中只考虑一个因子 ,它有 个水平 ,在每个水平下进行 次重复试验,r2,.r m其结果用 表示, 常常把数据列成如表 3 的形式:12,.,iimy,2.,i表 3水平 试验数据 和 均值 y1A121,.my1T12 22 r12,.rrmyrTry例 3:某连锁商业企业在同城三个不同的地点开了三家分店,从这三家分店随机抽了 5 天的营业额资料如表 4表 4第一家分店 第二家分店 第三家店第一天 10 7 14第二天 12 11 8第三天 9 8 12第四天 8 13 10第五天 11 10 11第 4 页 试分析这三家分店的平

11、均日营业额是否相同,从而确定地点因素是否对日均营业额有影响( ) ,如果把每一个分店的日营业额看成一个总体,以上问题的实质是检验这三个总体的均0.5值是否相等: ,其中, 分别为三分店的平0123123,:,H三 者 不 全 相 等 123,均日营业额.通过 excel,进行单因素方差分析,可以得到两个统计表,并且得出 统计量:F表 5方差分析:单因素方差分析组 观测数 求和 平均 方差列 1 5 50 10 2.5列 2 5 49 9.8 5.7列 3 5 55 11 5方差分析差异源 SdfMSF-valueP critF组间 4.133333333 2 2.06666667 0.4696

12、97 0.636215 3.885294组内 52.8 12 4.4总计 56.93333333 14由上表可得: ,样本的统计量56.93,4.1,5.8,2.067,4.STSAESASE,分析表给出了临界值是 , ,接受 ,即没有充分证据说2.0674F= 3aFaF0H明三个分店的地点不同对日均营业额产生了影响.如果直接从 值进行判断,由于P,结论也是接受原假设.310P值6.1 重复数不等的方差分析例 4: 某型号化油器原中小喉管的结构使油耗较大,为节约能源,设想了两种改进方案以降低油耗.油耗的多少用比油耗进行度量,现在对用各种结构的中小喉管制造的化油器分别测定其比油耗,数据如下.假

13、定每一种结构下的比油耗服从等方差的正态分布,试问中小喉管的结构对平均比油耗的影响是否显著.表 6水平: 原结构1A11.0 12.8 7.6 8.3 4.7 5.5 9.3 10.3: 改进方案 122.8 4.5 -1.5 0.2: 改进方案 234.3 6.1 1.4 3.6现在对这些数据做方差分析用 excel,有下表 7表 7方差分析:单因素方差分析组 观测数 求和 平均 方差行 1 8 69.5 8.6875 7.518393行 2 4 6 1.5 7.126667行 3 4 15.4 3.85 3.776667方差分析差异源 SdfMSF-valuePcritF组间 155.645

14、6 2 77.82281 11.85507 0.001174 3.805565第 5 页 组内 85.33875 13 6.564519总计 240.9844 15设 ,从 分布表查得 ,由于求得 的,所以在水平上因子 是显0.5F0.95(2,13).83.81FA著的,说明不同的中小喉管结构生产化油器的平均比油耗有明显的差异.6.2 各水平均 值与误差方差 的估计i当因子 是显著的,我们还可以给出每一水平均值 与水平效应 的估计,以便找出最好的水平.Aiia,它们都是相应参数的无偏估计,从而第 个水平均值的无偏估计为,iiyaiii误差方差的无偏估计: ,可取得 的估计为 .2eMSAeM

15、S6.3 多重比较在单因子方差分析中,若经 检验拒绝原假设 ,这表明,因子 的 个水F012:.rHAr平均值不全相等,但不一定两两之间都有差异.故还需进一步去确认哪些水平均值之间确有显著的差异,哪些水平之间无显著的差异.这就要进行多重比较.同时比较任意两个水平均值间有无显著差异的问题称为多重比较.这里的关键词是“同时”两字.若有 r(r2)个水平均值 ,则同时检验以下12,.r个假设的检验就是多重比较的问题: 譬如在 时,多重比较2r 0:,ijjij3问题就是要同时检验如下三个假设 :直接考虑,当 为真121332023:,: 0ijH时, 不应过大,过大就应拒绝 .因此在同时考虑 个假设

16、时, “诸 中至少有一个不成jiy0ijH2r 0ij立”就构成多重比较的拒绝域,它应有如下形式: 这里 表示 水平下数据的ijijijWyciyiA平均值, .对于给定的显著性水平,就要确定这样的临界值 ,使得上述 个假设都成1,2ir ij2r立时有 . ()pW7 两因子方差分析如果在一个试验中需要同时考察两个因子 和 ,并设因子 有 个水平,因子 有 个水平,ABArBs这时共有 个不同的试验条件,也就是说有 个总体.现做如下假设: 每一个总nrs n体的分布是正太分布,其均值为 ,它与因子 及 的水平有关;其方差相等,都是 .ij 2现在我们不仅需要分析因子 的不同水平对指标的均值有

17、无显著的影响,还需要分析因子 的不同水平对指标的均值有无显著的影响,有时还需要回答两个因子不同水平的搭配对指标的均值有无特殊的影响,这种特殊影响如果存在就称为因子 与 间有交互作用,记为 或 .A7.1 无交互作用下的方差分析:设 与 是可能对试验结果有影响的两个因素,相互独立,无交互AB作用.设在双因素各种水平的组合下进行试验或抽样,得数据如表 8:表 8因素 均值12 nB1AX1 1X1.2212 2n2. 因素 r1r2r rn.r均值 .X. .X表中每行均值是在因素 的各个水平上试验结果的平均数;表中每列的均值是在因素A B第 6 页 的各种水平上试验的平均数.以上数据的离差平方和

18、分解形式为: 2 22. .12 2. . ., , .rn i iijij ij ij j jijiij j ijSTXSAXnXBrSEX上式中, 表示的是因素 的组间方差总和, 是因素 的组间方差总和,都是由各因素在不AB同的水平下各自的均值差异引起的; 仍是组内方差的部分,由随机误差产生.各个方差的自由度是:SE的自由度为 , 的自由度为 , 的自由度为 , 的自由度为ST1nr1r1nSE.各个方差对应的均方差是:对因素 而言, 对因素 而言,()nr A1AMrB;对随机误差项而言,BMMSnr我们得到检验因素 与 影响是否显著的统计量分别是A, .1,SFrE1,BSFnrE例

19、5:某企业有三台不同型号的设备,生产同一种产品,现有五名工人轮流在此三台设备上操作,记录下他们的日产量如表所示.试根据方差分析说明这三台设备之间和五名工人之间对日产量的影响是否显著? 0.表 9工人 1 工人 2 工人 3 工人 4 工人 5设备 A 64 72 63 81 78设备 B 75 66 61 73 80设备 C 78 67 80 69 71解:检验的假设有两个,第一个假设是针对设备(设为 因素)的:H 01:三台设备对日产量没有显著A影响; :三台设备对日产量有显著影响.第二个假设是针对人员(设为 因素)的: :工人技1H B02H术对日产量没有显著的影响; :工人技术对日产量有

20、显著影响.12H将以上数据输入 excel 表格中,进行 “无重复双因素分析” ,输出的方差分析表如下:方差分析:无重复双因素分析表 10观测数 求和 平均 方差设备 A 5 358 71.6 65.3设备 B 5 355 71 56.5设备 C 5 365 73 32.5工人 1 3 217 72.33333 54.33333工人 2 3 205 68.33333 10.33333工人 3 3 204 68 109工人 4 3 223 74.33333 37.33333工人 5 3 229 76.33333 22.33333方差分析差异源 SdfMSF行 10.5333 2 5.266667

21、 0.092371列 161.0667 4 40.26667 0.706226第 7 页 误差 456.1333 8 57.01667总计 627.7333 14从表中可知: 接受 ,没有证据证明三台设备对日产量有显著影响;0.5.92(,8)4.6AF01H,接受 ,也没有证据证明五名工人的技术对日产量有显著影响.0.5.76(4,)3B 027.2 有交互作用的方差分析:为了研究两个因素是否独立,有无交互作用,我们需要在各个因素水平的组合下,进行重复试验;因此,有交互作用时,方差分析的数据结果不同于无交互作用的情形.设因素 与因素 每一对水平搭配下重复试验的次数都是 ,得试验数据结构如表

22、11:m表 11因素 B1B2 nBX1 1X122 2n 1Am1m 1m212 2nX X 221m2m 2nm r1r 1r12X2 2nX 因素Arrmrm rm表中的 表示的是在因素水平组合 下第 次试验的结果.在此组合下试验结果的平均值为:ijlX,ijABl.1mijijll进一步记: 则我们类似有以下的离. .111,nmrmi jijl ijl ijljl il ijlXXXrn差平方和分解形式: 式中 ,STASBSE2 22 .2. .(), , jijl iijl i jijij ijijlij ijlSBrmBmXXX与无交互作用的双因素方差分解相比,这里多出了一项

23、,它刚好反映了两个因素交互作用的结A果.离差平方和 , , , 和 的自由度分别是STASBSE.我们得到如下的均方差:1,(1)(1)rnrnr和, ,.1(1)BSEMMMnrrnm则检验因素 与 影响是否显著的统计量分别是:B.1,A BSFrmFrE检验交互影响是否显著的统计量是:第 8 页 .1,ABMSFrnrmnE例 6:为了分析光照因素 与噪音因素 对工人生产有无影响,光照效应与噪音效应应有交互作用,在此两因素不同的水平组合下做试验,结果如表 12:表 12因素因素 12B3B1A15 15 17 19 19 16 16 18 21217 17 17 15 15 15 19 2

24、2 223A15 17 16 18 17 16 18 18 18418 20 20 15 16 17 17 17 17解: 检验的假设有三个:光照因素 对产量没有显著影响; :光照因素 对产量有显著影响;01HA1HA:噪音因素 对产量没有显著影响; :噪音因素 对产量有显著影响;2B2B:光照效应与噪音效应没有交互作用; :光照效应与噪音效应有交互作用.3 3将以上数据输入 excel 表格中,进行 “有重复双因素分析” ,输出的方差分析表 13:表 13方差分析:可重复双因素分析SUMMARY 1A23A4总计1B观测数 3 3 3 3 12求和 47 51 48 58 204平均 15.

25、66667 17 16 19.33333 17方差 1.333333 0 1 1.333333 2.909092B观测数 3 3 3 3 12求和 54 45 51 48 198平均 18 15 17 16 16.5方差 3 0 1 1 2.272733B观测数 3 3 3 3 12第 9 页 求和 55 63 54 51 223平均 18.33333 21 18 17 18.5833方差 6.333333 3 0 0 4.08333总计观测数 9 9 9 9求和 156 159 153 157平均 17.33333 17.66667 17 17.44444方差 4.25 7.75 1.25

26、2.777778方差分析差异源 SdfMSF-valueP样本 28.38889 2 14.19444 9.462963 0.00093列 2.083333 3 0.694444 0.462963 0.71077交互 63.83333 6 10.63889 7.092593 0.0002内部 36 24 1.5总计 130.3056 35接受 ,没有充分证据证明光照对产量有显著影响; ,拒绝01H 0.59.462(,24)3.08BF,有充分证据说明噪音对产量有显著影响; ,拒绝 ,2 .70519A 03H有充分证据说明光照与噪音存在交互作用并由此对产量产生显著影响.8 方差齐性检验,正态

27、性检验与诊断以上分析都是基于方差分析中对数据的三项假定(正态性,方差齐性与数据间独立性)成立下进行的.那么这些假定是否满足?只有试验是按随机次序进行的,那么独立性一般不成问题.下面先讨论方差齐性.设第 个总体的分布为 ,从中获得的样本是 ,记样本方差为i 2(,)iN12,.iimy,则方差齐性所要检验的假设可以表示为:2,1,.isr,对此通常采用 Bartlett 检验,检验统计量为:222201:,:,.rrHH不 全 相 等其中 ,对给定的显著性水平 ,2lnlneiiiSfmsc13riiecf拒绝域为: ,该检验不管重复数是否相等均可使用.21r例 7:如在上面的化油器问题中,检验三个总体的方差是否相等.解:本题中所涉及的三个总体对应的样本方差分别为:由上面可知: 在 0.05 水平2221358,7.0,.7,84,sssm6.5,13,eeMSf上拒绝域为 .951现在, ,1 11.23273riiecmf

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。