1、1,多个样本均数比较的方差分析,Analysis of Variance,第二军医大学卫生统计学教研室 张罗漫,第四章,2,用途 比较某实验(处理)因素不同水平样本均数间差别有无统计学意义,从而说明该实验因素某水平是否有作用的方法。,种类 根据实验因素的数量分为: 单因素方差分析 多因素(两因素及以上)方差分析,方差分析由R.A.Fisher(英)首创,又称F检验 缩写:ANOVA,3,Ronald Aylmer Fisher 爵士(18901962)是现代统计学的奠基人之一。 他年青时在剑桥大学主修数学,研究误差理论、统计力学和量子理论。他对统计理论与方法的主要贡献:相关系数的抽样分布、方差
2、分析、实验设计原则。,4,第一节 方差分析的基本思想和应用条件,5,一、名词解释,处理因素和水平研究者对研究对象人为地施加某种干预措施,称为处理因素(factor)或实验因素;处理因素所处的不同状态称为水平(level)。 处理因素的水平数2,即实验的组数。,6,三组战士行军后体温增加数() 不饮水 定量饮水 不限量饮水 1.9 1.4 0.9 1.8 1.2 0.7 1.6 1.1 0.9 1.7 1.4 1.1 1.5 1.1 0.9 1.6 1.3 0.9 1.3 1.1 0.8 1.4 1.0 1.0 1.6 1.2 0.9,处理因素:饮水方式 水平数=3,7,单因素实验 实验中的处理
3、因素只有一个,这个处理因素包括g(g2)个水平,分析不同水平实验结果的差别是否有统计学意义。,多因素实验实验中的处理因素2,各处理因素的水平2,分析各处理因素各水平的实验结果有无差别、有无交互作用。,8,研究一种降血脂新药的临床疗效,研究对象:高血脂病人(120例) 处理因素:降血脂药物 水 平:服降血脂新药2.4g组 服降血脂新药4.8g组 服降血脂新药7.2g组 安慰剂组试验效应:低密度脂蛋白测量值(mmol/L),单因素实验,9,安慰剂组,3.53,4.59,4.34,2.66,2.59,30,3.43,102.91,367.85,降血脂新药2.4g组,2.42,3.36,4.32,2.
4、34,2.31,30,2.72,81.46,233.00,降血脂新药4.8g组,2.86,2.28,2.39,2.28,1.68,30,2.70,80.94,225.54,降血脂新药7.2g组,0.89,1.06,1.08,1.27,3.71,30,1.97,58.99,132.13,低密度脂蛋白测量值(mmol/L),分 组,n,4个处理组低密度脂蛋白测量值,合 计 120 2.70 324.30 958.52,10,研究饲料中脂肪含量高低、蛋白含量高低对小鼠体重的影响研究对象:小白鼠 处理因素:含脂肪饲料、含蛋白饲料 水 平:脂肪含量 高 低 蛋白含量 高 低 高 低试验效应:小鼠体重增加
5、量,多因素实验,11,组间变异,总变异,组内变异,二、方差分析的基本思想(单因素),12,三组战士行军后体温增加数() 不饮水 定量饮水 不限量饮水 1.9 1.4 0.9 1.8 1.2 0.7 1.6 1.1 0.9 1.7 1.4 1.1 1.5 1.1 0.9 1.6 1.3 0.9 1.3 1.1 0.8 1.4 1.0 1.0 1.6 1.2 0.9,Xij=+Ti+eij i=1, 2, , g j=1, 2, , n,13,组间离均差平方和(处理因素+随机误差),组内离均差平方和(随机误差),总离均差平方和,sum of squares of deviations from m
6、ean ,SS,14,15,mean square ,MS,16,如果处理因素无作用: 组间变异组内变异 F = 如果处理因素有作用: 组间变异组内变异 F ,17,18,三、应用条件,1.各样本是相互独立的随机样本;2.各样本数据均服从正态分布;3.相互比较的各样本的总体方差相等, 即方差齐性(homogeneity of variance)。,19,20,第二节完全随机设计资料的方差分析,21,一、完全随机设计 completely random design,各组例数可以相等或不等,甲处理(n1),乙处理 (n2),丙处理(n3),试验对象 (N),随机化分组,22,例 为了研究一种降血
7、脂新药的临床疗效, 按统一纳入标准选择120名患者, 采用完全随机设计方法将患者等分为4组进行双盲试验。,完全随机设计分组结果,130 甲 3160 乙 6190 丙 91120 丁,23,安慰剂组,3.53,4.59,4.34,2.66,2.59,30,3.43,102.91,367.85,降血脂新药2.4g组,2.42,3.36,4.32,2.34,2.31,30,2.72,81.46,233.00,降血脂新药4.8g组,2.86,2.28,2.39,2.28,1.68,30,2.70,80.94,225.54,降血脂新药7.2g组,0.89,1.06,1.08,1.27,3.71,30,
8、1.97,58.99,132.13,低密度脂蛋白测量值(mmol/L),分 组,n,4个处理组低密度脂蛋白测量值,合 计 120 2.70 324.30 958.52,Xij=+Ti+eij,24,二、变异分解,25,完全随机设计资料方差分析公式,变异来源 SS MS F值,校正数:,N1,总变异,组 间,g1,组 内,Ng,26,三、分析步骤,H0: 1= 2= 3 = 4 H1: i不等或不全相等=0.05,27,28,方差分析表,变异来源 SS MS F P 总 82.10 119 组间 32.16 3 10.72 24.93 0.01 组内 49.94 116 0.43,附表3,结论:
9、按=0.05水平,拒绝H0,接受H1,认为四组均数的差异有统计学意义 ,不同剂量药物对血脂中低密度脂蛋白降低有影响。,29,注意:当拒绝H0,接受H1,不能说明各组总体均 数两两间都有差别,要进行多个均数间多 重比较。,30,第三节随机区组设计资料的方差分析,31,又称配伍组设计 是配对设计的扩大先按影响实验结果的非处理因素(如性别、 体重、年龄、职业、病情、病程等)将受试对象配成区组,再分别将区组内的受试对象随机分配到各处理组或对照组。,一、 随机区组设计 randomized block design,将区组间变异从组内变异中分离出来,减少 了组内变异,提高了统计检验效率。,32,例:比较
10、三种抗癌药物对小白鼠肉瘤抑瘤效果,处理因素:抗癌药物(A、B、C)实验对象及例数:染肉瘤小白鼠15只实验效应:肉瘤重量控制因素:小白鼠体重实验设计:随机区组设计方法:将体重相近的3只小白鼠配为一个区 组,共5个区组;在区组内随机分配 处理因素。,33,不同药物作用后小白鼠肉瘤重量(g),Xij=+Ti+Bj+eij,34,例 如何按随机区组设计,分配5个区组的15只 小白鼠接受甲、乙、丙三种抗癌药物?,5个区组小白鼠按随机区组设计分配结果,35,二、变异分解,36,随机区组设计资料方差分析公式,变异来源 SS MS F值,N1,总变异,处理 间,g1,误 差,(n-1)(g-1),区组间,n1
11、,37,三、分析步骤,H0: 1= 2= 3 H1: i不等或不全相等=0.05,38,39,40,方差分析表,变异来源 SS MS F P 总 0.5328 14 处理间 0.2280 2 0.1140 11.88 0.01 区组间 0.2284 4 0.0571 5.95 0.05 误差 0.0764 8 0.0096,结论:按=0.05水平,拒绝H0,接受H1,认为三组均数的差异有统计学意义,三种抗癌药物对小白鼠肉瘤抑瘤效果有差别。,41,变异来源 SS MS F P 总 0.5328 14 处理间 0.2280 2 0.1140 11.88 0.01 区组间 0.2284 4 0.05
12、71 5.95 0.05 误差 0.0764 8 0.0096,区组间差别有统计学意义解释由于控制了区组因素(体重),误差由0.0254减少到0.0096,提高了检验效率。,处理间 0.2280 2 0.1140 4.49 0.05 区组+误差 0.3048 12 0.0254,42,第四节 拉丁方设计资料的方差分析,43,设计方法 研究目的 非处理因素控制 完全随机设计 处理因素 随机化分组平衡 随机区组设计 处理因素 区组(行方向) 可控制一个主要 非处理因素 拉丁方设计 处理因素 行与列方向 可控制二个主要 非处理因素,一、拉丁方设计 latin-square design,44,拉丁方
13、是用拉丁字母排列为KK的方阵 K =处理因素水平数 例:K=4 列 1 2 3 4 1 A B C D 行 2 B C D A 3 C D A B 4 D A B C,45,行和列安排两个需控制的非处理因素拉丁字母个数代表处理因素水平数行数=列数=处理水平数处理的每个水平在行或列中只出现一次使用时应对基本拉丁方随机化 列 1 2 3 4 1 A B C D 行 2 B C D A 3 C D A B 4 D A B C,46,研究目的:比较6种不同药物对家兔注射后产生 的皮肤疱疹大小处理因素:药物处理因素水平:甲、乙、丙、丁、戊、己实验对象:家兔6只实验效应:皮肤疱疹大小控制因素1:不同受试对
14、象(6只家兔)控制因素2:每只家兔不同注射部位(6个),47,A B C D E F B A F E D C C D A B F E D F E A C B E C B F A D F E D C B A,66基本拉丁方,48,行变换:随机数 22 06 34 72 52 82 秩 次 2 1 3 5 4 6 对 调 列变换: 随机数 27 29 99 72 68 53 秩 次 1 2 6 5 4 3 对 调 分配处理:药 物 甲 乙 丙 丁 戊 己 随机数 35 56 27 09 24 86 秩 次 4 5 3 1 2 6 字 母 D E C A B F,66基本拉丁方随机化,49,66基本
15、拉丁方行与列随机对调,家兔编号 注射部位编号(列区组)(行区组) 1 2 3 4 5 6 1 A B C E D F 2 B A E F C D 3 E D F C B A 4 F C B D A E 5 C F D A E B 6 D E A B F C,处理因素(药物):A B C D E F,50,家兔编号 注射部位编号(列区组)(行区组) 1 2 3 4 5 6 1 A73 B75 C67 E61 D69 F79 2 B83 A81 E99 F82 C85 D87 3 E73 D60 F73 C77 B68 A74 4 F58 C64 B64 D71 A77 E74 5 C64 F62
16、 D64 A81 E85 B71 6 D77 E75 A73 B59 F85 C82,处理因素(药物):A B C D E F,Xijk=+Ti+Rj+Ck+eijk,6种药物注射家兔后产生皮肤疱疹大小(mm2),51,家兔 注射部位编号编号 1 2 3 4 5 6 1 A73 B75 C67 E61 D69 F79 424 70.7 2 B83 A81 E99 F82 C85 D87 517 86.2 3 E73 D60 F73 C77 B68 A74 425 70.8 4 F58 C64 B64 D71 A77 E74 408 68.0 5 C64 F62 D64 A81 E85 B71
17、427 71.2 6 D77 E75 A73 B59 F85 C82 451 75.2,6种药物注射家兔后产生皮肤疱疹大小(mm2),合计Ci 428 417 440 431 469 467 71.3 69.5 73.3 71.8 78.2 77.8,药 物 D E C A B F 合计Tk 428 467 439 459 420 439 71.3 77.8 73.2 76.5 70.0 73.2,合计Rj,52,二、变异分解,53,拉丁方设计资料方差分析公式,变异来源 SS MS F值,N1,总变异,处理间,g1,行区组,g1,列区组,g1,误 差,(g-1)(g-2),54,三、分析步骤,
18、55,方差分析表,56,结论:处理因素:按=0.05水准,可以认为6种药物注射家兔后产生皮肤疱疹大小均数的差别无统计学意义。非处理因素:按=0.05水准,认为6只家兔皮肤疱疹大小均数的差别无统计学意义。 6个注射部位皮肤疱疹大小均数的差别有统计学意义。,57,拉丁方设计的缺点,实验设计要求行数=列数=处理水平数 ,该条件实际工作中一般不易满足。在处理的水平数较少时,试验的重复数较少(如33拉丁方设计,重复例数为3),此时检验效率较低。,58,第五节两阶段交叉设计资料的方差分析,59,一、两阶段交叉设计 Cross-over Design,60,完全随机分组设计例:比较两种药物(试验药与对照药)
19、疗效 试验组(n1)将N个受试对象随机分组 对照组(n2)特点:每个受试对象接受一种处理,然后比 较两组受试对象的试验效应。,61,完全随机分组设计缺点,1.完全随机分组设计组间非处理因素的分布不可能完全一致(特别是例数较少时)。2.处理因素的试验效应通过受试者反映,试验效应受个体差异影响。3.当非处理因素影响较大时,所需样本例数较多。,62,消除(减少)个体变异方法,1.试验前后设计 每个研究对象只接受一种处理2.配对(配伍)设计 每个研究对象只接受一种处理3.交叉设计 每个研究对象可接受两种处理,63,两阶段交叉设计模式,随 机 试验阶段 分 组 甲组(n1) 甲药 乙药 N 乙组(n2)
20、 乙药 甲药,64,两阶段交叉设计优点,1.每个试验对象先后接受两种处理,可成倍使用试验对象,例数少于完全随机分组设计。2. 试验设计采用自身对照,可减少个体变异对试验效应的影响,试验结果较准确,统计检验效率高于完全随机分组设计。,65,1.两阶段间常安排洗脱( wash out)阶段,比完全随机分组设计试验时间长。2. 两阶段间不能有延滞(carry-over)效应。即前一时期处理的效应不能延续到后一时期的处理效应上。3.多用于治疗慢性病药物(如安眠、降血压等)的疗效比较。,两阶段交叉设计缺点,66,二、两阶段交叉设计举例,1.完全随机设计安排受试对象例 用A、B两种闪烁液测定10名受试者血
21、 浆中3H-cGMP的交叉试验2.随机区组设计安排受试对象,67,随机数 22 19 16 78 03 93 23 15 58 57秩 号 5 4 3 9 1 10 6 2 8 7规 定 秩号奇数处理先A后B,偶数先B后A,1 2 3 4 5 6 7 8 9 10,受试对象编号,受试对象编号 阶段1 阶段2 1 A B 2 B A 3 A B 4 A B ,68,受试者 阶 段 受试者合计编 号 Bi 1 A 760 B 770 1530 2 B 860 A 855 1715 3 A 568 B 602 1170 10 B 800 A 803 1603阶段合计 S1=7271 S2=7370处
22、理合计 TA=7289 TB=7352 X= 14641,两种闪烁液测定血浆中3H-cGMP的交叉试验,Xijk=+Ti+Oj+Sk+eijk,69,三、两阶段交叉设计数据的方差分析,70,71,72,方差分析表,变异来源 DF SS MS F P 总变异 19 552194.95 A B处理间 1 198.45 198.45 4.02 0.05阶段间 1 490.05 490.05 9.92 0.05 受试者间 9 551111.45 61234.61 1240.07 0.05 AC 0.30 3 6.85 4.04 5.64 0.01 AB 0.18 2 4.11 3.26 4.75 0.
23、05,a为均数排序后对比组间所包含的组数,a越大,q0.05, 越大,避免犯型错误。,结论: B药与C药抑瘤效果差别无统计学意义, 服A药后小鼠肉瘤重量高于服C药与B药 的,A药抑瘤效果比C药与B药的差。,91,总 结,方差分析(F 检验) 是多个均数间整体性的比较,如果F值无统计学意义,说明处理因素无作用。均数间的多重比较 整体比较有统计学意义后进行均数间两两比较,常用方法:LSD-t、 Dunnett-t检验,92,第七节 多样本方差齐性检验,一、Bartlett法二、Levene法,93,一、Bartlett法例 试分析各处理组的低密度脂蛋白值是否满 足方差齐性?,94,95,结论:按=0.10水平,不拒绝H0,还不能认为4个试验组的低密度脂蛋白值不满足方差齐性。,96,二、Levene法 所分析资料可不具有正态性,97,98,注意 1.在实际应用中,完全随机设计多组数据均数的比较,一定要做方差齐性检验。2.如不满足方差齐性假定,应改用秩和检验做比较。3.Bartlett检验法要求资料具有正态性。 4.用Levene检验法进行方差齐性检验时,不要求资料具有正态性。,99,本章重点 1.方差分析基本思想2.完全随机设计资料方差分析 随机区组设计资料方差分析3.多个样本均数间的多重比较,100,Thank you!,