1、医学重复观测数据裂区方差分析的假定条件的检验作者:陈长生,徐勇勇,赵东涛 【关键词】 重复观测 关键词: 重复观测;假设检验;方差分析 摘 要:目的 重复观测数据存在自相关性常导致一元方差分析的误用,探讨一元方差分析两个假定条件的检验. 方法 通过标准正交对比变换克服数据间的自相关性,应用似然比统计量进行假定条件的检验. 结果 给出了重复观测数据一元方差分析的假定条件检验方法,并用软件 REP 得以实现. 结论 只有满足假定条件,才可以保证重复观测资料单变量方差分析的有效性. Keywords:repeated measures;hypothesis test;analysis of vari
2、ance; Abstract:AIM To explore the tests for two presuppositions concerning the validity of the univariate analysis of variance with repeated measures.METHODS The authors intro-duced orthonormal contrast transformation to avoid auto-cor-relation,and proposed the tests of presuppositions by likeli-hoo
3、d ratio statistics.RESULTS Hypothesis tests for the presuppositions of the univariate ANOVA with repeated mea-sures were given,and a proper software named REP was implemented.CONCLUSION The validity of the univariate ANOVA with repeated measures will not be ensured unless the presuppositions are sat
4、isfied. 0 引言 医学与卫生统计的传统分析方法注重的是数据的独立性,而医学研究中重复观测数据往往具有自相关性,因而重复观测数据的分析有别于一般的统计分析1-4 .为了克服重复观测数据的自相关性,我们讨论了正交多项式变换的方法,并在此基础上,着重进行了这类数据一元方差分析的假定条件的检验,以便用常规裂区方差分析方法进行统计分析. 1 原理和方法 对于重复观测数据,为了保证一元方差分析的有效性,常有两个假定条件:齐性条件和球对称(sphericity)条件 5,6 . 1.1 正交多项式变换 值得注意的是,上述假定条件要求的是各组的标准正交对比协方差阵齐性且共同的标准正交对比的协方差阵为
5、2 I,I 为单位阵.因此,对它们进行假设检验时,一般先要进行数据的正交多项式变换,具体方法步骤见文献7. 经正交多项式变换后,每一观察单位的 p 个重复测量数据可转换成(p-1)个新变量 Ts(s=1,p-1) ,这(p-1)个新变量的协方差阵就是标准正交对比协方差阵.有了标准正交对比协方差阵 SO ,就可进行假定条件的检验. 1.2 齐性条件的检验 检验齐性条件时,检验方法同一般的多组间协方差阵齐性检验.其方法步骤如下8 :假设 k 个组,第 i 组有 Ni 个观察单位,每个观察单位有 p 个重复测量值,即第 i 组第 j 个观察单位有如下 p 个值:Yij =(xij1 ,xij2 ,x
6、 ijp ) j=1,2,Ni ,i=1,2,k 若Yij 服从正态独立分布 Np (i ,i ) ,则检验假设为 H0 :1 =2 =k ,H1 :i 不全相等. 由于经过标准正交对比变换后,原 p 个数据变量转换为 p-1 个新变量,故进行标准正交对比协方差阵 SO 齐性检验时,重复测量次数 p 要用p-1 来替换,检验假设也要用 Oi 来代替原来的 如果满足一元方差分析的假定条件,我们就可用熟悉的一元裂区方差分析法来分析重复观测数据资料. 2 实例分析 对 20 名患者分别给予两种不同的药物,组有患者 6 名,组有患者 14 名,对其手术前后的症状进行评分5 (Tab1).表 1 患者症
7、状得分(略) 要判断该资料是否满足假定条件,可先进行正交多项式回归拟合,即 Y =p-1t=0 A t Tt (x) , Tt (x)=t q=0 fx q tq p=6,t=0,1,2,5 对每一个体都可拟合一正交多项式以得到经标准正交对比变换后的新变量T1 -T5 ,这样原始数据就变为相互独立的 T 1 -T5 ,可以分组求得它们的协方差阵 So1 和 So2 . 下面可用 So1 和 So2 来进行假定条件的检验 .检验假设:H0 :o1 =o2 H1 :o1 o2REP9 计算结果,近似 2 =18.624,=15,P=0.2313,不拒绝 H0 ,可认为协方差阵齐性,即原始数据的标准
8、正交化协方差阵齐性(即满足齐性条件).由于标准正交化协方差阵齐性,故可进一步作球对称矩阵检验,经 REP 计算得到检验结果,渐近 2 =12.8211,=14,P=0.5407,不拒绝 H0 ,可认为该资料满足球对称条件. 由于满足一元方差分析的假定条件,因此,一元方差分析时,可直接进行常规的裂区方差分析(Tab2).表 2 方差分析表(略) 以上方差分析结果表明,药物组间得分没有显著差别,时间与药物间不存在交互作用,但时间对试验结果有非常显著的影响. 3 讨论 尽管假定条件是针对标准正交对比协方差阵而言,但如果各组原始数据的协方差阵齐性且满足组内相关阵时,可直接进行单变量裂区方差分析.因为对
9、组内相关矩阵作用一个正交对比矩阵可将其转换为球对称矩阵 2 I,即满足假定条件.但在本文实例中,两组原始数据的协方差阵不齐(近似 2 =71.3415,=21,P0.0000) ,故需进行正交多项式变换. 若假定条件得不到满足,有二个方法可继续进行分析.方法一:进行多元分析(如轮廓分析) ,其对协方差阵不作要求,但把握度相对来说较低,统计结果不好解释10-13 .方法二:对一元 F 统计量进行校正,通过求出球对称系数 (index of sphericity)以校正分子、分母的自由度,从而获得校正的概率,即进行校正的一元裂区方差分析10,14,15 . 对重复观测数据进行处理时,假定条件未经检
10、验就直接应用常规分析方法常会导致统计分析方法的误用.因为假定条件不满足时所得到的概率 P 都偏 低,使得差异容易显著,即犯型错误的概率增大,尤其当球对称系数 较小时,假阳性率将更大.在实际工作中,当 1 时, 对检验的概率 P 都有一定的影响, 越小,校正后的概率 P 比校正前的越大,即校正 F 界值越大.一般情况下,当求出的 F 值远远超过或小于F 临界值时,可以不进行校正,因为校正后的结论仍将相同,但当求出的F 值稍大于不校正 F 界值时,校正尤其必要,往往会改变原来的结论.如果对资料进行多元分析,此时,多元分析的结论将可能与未校正的一元方差分析的结论不一致. 参考文献: 1Chen CS
11、,Xu YY,Cao XT.Statistical methods for repeated measures data in medical research J.Zhongguo Weisheng Tongji(Chin J Health Stat) ,1996;13(6):55-57. 2Chen CS,Xu YY,Wu B.Response feature analysis of longitu-dinal data in medical research J.Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ) ,2000;21(1):15-
12、17. 3Chen CS,Xu YY,Wu B,Shang L.Multivariate growth curve model of longitudinal data in medical research J.Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ) ,2000;21(6):673-675. 4Chen CS,Xu YY,Zhang Y,Shang L,Wu B.Growth curve model for comparison of repeated measures data across medical treatment gro
13、ups J.Zhongguo Weisheng Tongji(Chi J Prev Med) ,1998;32(4):245-247. 5Crowder MJ,Hand DJ.Analysis of repeated measures M.London:Chapman and Hall,1990:1-45. 6Hearne EM.A test for serial correlation in univariate repeated-measures analysis J.Biometrics,1983;39:237-240. 7Chen CS,Xu YY,Cao XT.Orthogonal
14、regression models for comparison of unequally-spaced repeated measures data across groups J.Zhongguo Weisheng Tongji(Chin J Health Stat) ,1996;13(3):1-3. 8Srivastava MS,Carter EM.An introduction to applied multi-variate statistics M.New York:Elsevier,1983:324-346.9Chen CS,Xu YY,Cao XT.Implementation
15、 of REP and its ap-plication J.Zhongguo Weisheng Tongji(Chin J Health Stat) ,1998;15(6):5-7. 10Chen CS,Xu YY,Cao XT,Shang L.The adaptation of the uni-variate analysis of variance with repeated measures data of medicine J.Zhongguo Shuli Yiyaoxue Zazhi(J Math Med) ,1997;10(3):227-229. 11Chen CS,Xu YY,
16、Cao XT,Wu B.A Test for Serial Correlation with Repeated Measures J.Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ) ,1998;19(5):581-582. 12Johnson RA,Wichern DW.Applied multivariatestatistical anal-ysis M.3rd ed.New York:Prentice-Hall International,Inc.,1992:202-241. 13Vonesh EF and Chinchilli VM.Lin
17、ear and nonlinear models for the analysis of repeated measurements M.New York:Marcel Dekker,Inc.,1997:11-125. 14Follman D.Modelling transitional and joint marginal distribu-tion in repeated categorical data J.Statistics in Medicine,1994;13(5):467-477. 15Diggle PJ,Liang KY and Zeger SL.Analysis of longitudinal data M.Oxford:Oxford University Press,1994:26-78.