1、方差分析 四川大学华西公共卫生学院 流行病与卫生统计学系 张强 ,在试验研究中,将全部观察对象随机分为k个组,每个组给予不同的处理。 当k2时,两组总体均数是否相等的假设检验可采用前面介绍的t检验或Z检验; 当k2时,即检验两组以上总体均数是否相等时,t检验已不能满足要求,需采用本章介绍的方差分析(analysis of variance,简称ANOVA)。,方差分析的基本思想,例9.1 为研究大豆对缺铁性贫血的恢复作用,某研究者进行了如下实验:选取已做成贫血模型的大鼠 36 只,随机等分为3组,每组12只,分别用三种不同的饲料喂养:不含大豆的普通饲料、含10%大豆饲料和含15%大豆饲料。喂养
2、一周后,测定大鼠红细胞数(1012/L),试分析喂养三种不同饲料的大鼠贫血恢复情况是否不同?,表9.1 喂养三种不同饲料的大鼠红细胞数(1012/L),总变异=组间变异+组内变异,完全随机设计的单因素方差分析,1. 建立检验假设,确定检验水准,:3个总体均数相等,即喂养三种不同饲料的大鼠红细胞数相同,:3个总体均数不全相等,即喂养三种不同饲料的大鼠红细胞数不全相同,2. 计算检验统计量,表9.3 例9.1资料的方差分析表,随机区组设计的两因素方差分析,例9.2 利用随机区组设计研究不同温度对家兔血糖浓度的影响,某研究者进行了如下实验:将 24只家兔按窝别配成6个区组, 每组 4 只, 分别随机
3、分配到温度15、 20、 25、 30的4个处理组中,测量家兔的血糖浓度值(mmol/L),结果如下表9.4所示,分析4种温度下测量家兔的血糖浓度值是否不同?,表9.4 四种温度下测量家兔的血糖浓度值(mmol/L),1. 建立检验假设,确定检验水准处理组:,:4个总体均数全相等,即4种温度下家兔血糖浓度值相同,:4个总体均数不全相等,即4种温度下家兔血糖浓度值不全相同区组:,:6个总体均数全相等,即不同窝别家兔血糖浓度相同,:6个总体均数不全相等,即不同窝别家兔血糖浓度不全相同,2. 计算检验统计量,表9.6 例9.2资料的方差分析表,多个样本均数间的多重比较,方差分析的结果提供了各组均数间
4、差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数之间的差别具有或不具有统计学意义。 为得到这方面的信息,可进行多个样本均数间的两两比较,它又称为样本均数间的多重比较(multiple comparison)。,在检验多组均数差别的无效假设0时,常见的有以下两种情况:检验某几个特定的总体均数是否相等,其无效假设称为部分无效假设,即部分组所对应的总体均数相等,0:i=j(ij)。,2. 检验全部k个总体均数是否相等,其无效假设称为完全无效假设,即所有各组所对应的总体均数都相等,0:1=2k。,1. SNK-q检验 SNK为Student-Newman-Keuls三人姓氏的缩写
5、,检验统计量为q值,又常称为q检验。 一般在方差分析结果拒绝0:1=2k时,再用SNK-q检验进行多重比较。,例9.3 对例9.1资料三组总体均数进行两两比较。 1. 建立检验假设,确定检验水准,:任意两对比组的总体均数相等,:任意两对比组的总体均数不等,2. 计算检验统计量,首先将3个样本均数由大到小排列,并编组次:,表9.9 例9.1资料的SNK法检验计算表,在设计阶段就根据研究目的或专业知识而计划好的某些均数间的两两比较,它常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较,某一对或某几对在专业上有特殊意义的均数间的比较等,这时可采用Dunnett-,检验。其公式为,检验。,2
6、. Dunnett-,检验,例9.4 对例9.2资料,问20、25和30(均为实验组)分别与15(对照组)的总体均数是否不同? 1. 建立检验假设,确定检验水准,:任一实验组与对照组的总体均数相同,:任一实验组与对照组的总体均数不同,2. 计算检验统计量,表9.10 例9.2资料的Dunnett-,检验计算表,交叉设计的方差分析,交叉设计(cross-over design)可分为两阶段交叉设计和多阶段交叉设计,医学实际工作中应用较多的是前者。,交叉设计(cross-over design)是一种特殊的自身对照设计。 它克服了实验前后自身对照由于观察期间各种非实验因素对实验结果的影响所造成的偏
7、倚。,在进行设计时,最好将条件相近的观察对象配对,再用随机分配的方法决定其中之一先采用处理方式 A,再用处理方式B;另一研究对象则先用B再用A。 结果使得一半对象先接受A,再接受B;另一半对象先接受B,再接受A;两种处理方式在研究过程中交叉进行。,由于A、B两种处理方式先后实验的机会均等,因而平衡了实验顺序的影响,并且可以通过假设检验,对处理方式之间和时间先后之间的差别分别进行分析。,可见,交叉设计要求样本含量为偶数,最好并将条件相近的配对,随机分配决定进行处理方式A和B的顺序。,交叉设计的优点是: 1. 节约样本含量; 2. 能够控制时间因素及个体差异对处理方式的影响(因而它优于一般的自身对
8、照实验); 3. 每一个实验对象同时接受实验因素和对照(如安慰剂),从医德的观点出发,均等地考虑了每一个患者的利益。,使用交叉设计时应当注意:该设计的基本前提是两种处理方式不能相互影响,即首先进行的处理方式不应对后者的效应有所影响。 因此两次实验之间应当有必要的间隔,间隔时间的长短决定于药物从体内的排除时间(washout time)。研究者可以参照药典或预备实验中药物在血清中的衰减程度,决定其间隔期限。,2. 交叉设计不适用于病程较短的急性病治疗效果的研究,如大叶肺炎、急性扁桃腺炎等,因为在第一阶段给予实验措施该病便已治愈,第二阶段的措施则不可能反映出来。 因此,交叉设计只适用于某些病程相对
9、较长的疾病。,3. 交叉设计实验应尽可能采用盲法,使研究者和患者都不知道有效药物在哪一阶段使用,以免产生偏倚。 特别是容易使患者在第一阶段使用有效的药物后,便退出实验,这将会严重的影响研究结果。 因此应注意控制患者退出实验的比例,尽可能使其降低到最低程度。,例9.5 某医师研究A、B两种药物对失眠患者改善睡眠的效果,将12名患者按交叉设计方案随机分为两组,观察两种药物、两个阶段睡眠时间增加量 (h), 每个阶段治疗两周,间隔两周。第一组患者为AB顺序,即第一阶段服用A药,第二阶段服用B药;第二组为BA顺序,即第一阶段服用B药,第二阶段服用A药。结果见表9.11。,表9.11 失眠患者睡眠时间增
10、加量(h),2. 计算检验统计量,表9.13 表9.11资料的方差分析表,析因设计的方差分析,析因设计(factorial design) 中最简单的是两因素方差分析。 此时观察两个因素(分别记为A与B),每个因素两个水平,共有22=4种不同的因素水平组合。,在临床研究中,许多试验因素之间往往是相互联系、相互制约的,有时当一种因素的质和量改变时另一种现象的质和量也随之改变。 例如,当同时研究两种试验因素(如两种药物)的效果,每种因素又有两个水平(如用药和不用药)时,某种药物的水平变化有可能使另一种药物的水平也随之发生变化,此时析因设计(factorial design)是一种十分有用的设计。,
11、它不仅可以检验两因素各水平之间的差异有无统计学意义,而且可以检验两因素间的交互作用。 若两因素间存在交互作用,甲因素的水平改变时,乙因素的效应也相应有所改变;若无交互作用,两者是相互独立的。,析因设计的优点还在于可以节约样本含量,若将两种药物分别进行随机对照试验,析因设计将节约样本含量的1/2,若用两种药物相互对比的设计,可节约1/3的样本含量。,例9.6 为研究某降血糖药物对糖尿病及正常大鼠心肌磺脲类药物受体 SUR1 的 mRNA 的影响,某研究者进行了如下实验:将24只大鼠随机等分成4组:两组正常大鼠,另两组制成糖尿病模型,糖尿病模型的两组分别进行给药物和不给药物处理,剩余两组正常大鼠也
12、分别进行给药物和不给药物处理,测得各组mRNA吸光度的值(%)结果见表9.14。,表9.14 4种不同处理情况下吸光度的值(%),单独效应、主效应和交互效应,表9.15 例9.6资料吸光度均数的差别,AB两因素的交互效应的计算公式为:,例9.6中,图9.1 22析因设计交互作用示意图,表9.16 22析因设计方差分析计算表,2. 计算检验统计量,表9.17 例9.6资料方差分析表,如果交互作用无统计学意义,可直接采用表9.17对A、B两因素的假设检验结果。,重复测量资料的方差分析,重复测量(repeated measure)是指对同一观察对象的同一观察指标在不同时间点上进行多次测量,用于分析该
13、观察指标在不同时间上的变化规律。 这类资料在临床和流行病学研究中比较常见,例如,药效研究中常常要观察给药后不同时间点的血药浓度。,其主要特点是同一受试对象在不同时点的观察值之间彼此不独立,往往存在某种程度上的相关性。 因此,这类资料的方差分析具有一定的特殊性。,例9.7 临床上为指导脑梗患者的治疗和预后,某研究人员对不同类型脑梗患者酸性磷脂(AP)在不同时间点的变化,进行了如下观察:随机选取三种不同类型的脑梗(TIA、脑血栓形成、腔隙性脑梗塞)患者各8例,分别于脑梗发生的第24小时、48小时、72小时、7天分别采血,测量血中AP的值,结果见表9.18。,表9.18 不同类型脑梗患者AP的值(m
14、ol/L),表9.19 重复测量设计方差分析的计算表,2. 计算检验统计量,表9.20 三组患者在不同时间点上AP值比较的方差分析表,3. 确定P值,作出统计推断,根据表9.20的P值,时间与处理因素的交互项有统计学意义,可认为三种不同类型的脑梗患者的AP值在不同时间点上的变化是不同的。若想进一步了解三种不同类型的脑梗患者和四个时间点之间的差别,可固定某一因素的水平分析另一因素的效应。,重复测量资料方差分析的前提条件,进行重复测量资料的方差分析,除需满足一般方差分析的条件外,还需特别满足协方差阵(covariance matrix)的球形性(sphericity/circularity)或复合
15、对称性(compound symmetry)。 若球形对称性质不能满足,方差分析的结果会增大I型错误的概率。球对称性通常采用Mauchly检验(Mauchlys test)来判断,由于Mauchly检验的统计量的表达式较复杂,计算繁琐,通常是运用统计软件完成。,如果一个协方差阵主对角线的元素都相等而其他元素均为零,则称这个协方差阵具有球性。 采用Mauchly球性检验,可以作出是否拒绝“H0:总体协方差阵具有球性”的结论。,表9.21 Mauchly检验和球对称系数,表9.22 自由度调整值,表9.23 三组患者在不同时间点上AP值比较的方差分析表(G-G校正),方差分析对数据的基本假设是:
16、各次观察独立,即任何两个观察值之间均不相关; 每一水平下的观察值xij分别服从总体均数为 的正态分布; 各总体的方差相等,即具有方差齐性(homogeneity of variance)。 概括地表达为:任何观察值xij都是独立地来自具有等方差的正态总体。,多个方差的齐性检验,方差分析要求各样本的总体方差齐同。因此,在进行方差分析之前,有必要对各样本的总体方差进行齐性检验。检验假设为H0:k个总体方差相等,即 H1:k个总体方差不等或不全相等,Levene 检验法既可用于检验两总体方差齐性,也可用于检验多个总体的方差齐性。用于多样本方差齐性检验时,所分析的资料可不具有正态性。,例9.8 对例9
17、.1作方差齐性的Levene检验。,1. 建立检验假设,确定检验水准,:三个总体方差全相等,:三个总体方差不全相等,=0.10,2. 计算检验统计量,表9.24 例9.1的Levene方差齐性检验结果,表9.25 几种设计方案中,和,的分解,变量变换,变量转换是通过数学函数将原数据转换成新数据。其目的是: 改善方差齐性; 使得转换后的资料接近正态分布; 使得曲线关系直线化。经过转换的数据有可能满足方差分析、t检验或直线相关等统计学方法的应用条件。常用的数据转换方法有:,变量变换的类型:1对数变换2平方根变换3倒数变换4平方根反正弦变换,1.对数变换(logarithmic transforma
18、tion): 即将原始数据x的对数值作为新的分析数据。,对数变换常用于: 使服从对数正态分布的数据正态化。如环境中某些污染物的分布,人体中某些微量元素的分布等,可用对数变换改善其正态性。 使数据达到方差齐性,特别是各样本的标准差与均数成比例或变异系数CV接近于一个常数时。,2. 平方根变换(square root transformation): 即将原始数据x的平方根 作为新的分析数据。,平方根变换常用于: 使服从Poisson分布的计数资料或轻度偏态的资料正态化,例如放射性物质在单位时间内的放射次数,某些发病率较低的疾病在时间或地域上的发病例数分布等,可用平方根变换使其正态化。 当各样本的
19、方差与均数呈正相关时,可使资料达到方差齐性。,3. 倒数变换(reciprocal transformation): 即将原始数据x的倒数作为新的分析数据: x1x,倒数变换常用于数据两端波动较大的资料,可使极端值的影响减小。,4. 平方根反正弦变换(arcsine transformation): 即将原始数据x的平方根反正弦值作为新的分析数据。变换公式有两种: (1) 用角度表示:xsin-1 (2) 用弧度表示:,平方根反正弦变换常用于服从二项分布的率或百分比的资料,如流行病学研究中疾病的发病率、患病率,实验研究中白细胞分类计数(%)、淋巴细胞转变率(%)。 一般认为,当总体率较小(如30)或较大(如70)时,偏离正态较为明显,通过样本率的平方根反正弦变换,可使资料接近正态分布,达到方差齐性的要求。,
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。