1、配对四格表资料的条件 Logistic 回归模型的 Bayes 分析【摘要】 用 Bayes理论探讨配对四格表资料的条件 Logistic回归模型的参数估计和假设检验问题。 【关键词】 配对四格表;条件 Logistic回归模型;Bayes配对四格表资料的一般格式如表 1所示。表 1 配对四格表资料的一般格式对照病 配对四格表资料的条件 Logistic回归模型为logitP=x,其中 x为暴露因素,暴露时 x=1,非暴露时 x=0。我们知道ln(p1/(1-p1)p0/(1-p0)=logitP1-logitP0=,即 ln(OR)=。用配对四格表直接计算的 OR=cb ,即 OR=cb=c
2、/(+c)b/(b+c)=p1-p,很明显,此处 p为二项分布 B(n,p) 中的参数 p,其中 n=b+c 。在此基础上,我们可以利用 p 的 Bayes估计进而得到 的估计,同样的,我们可以用 Bayes方法对假设检验问题 H0:OR=1vsH1:OR1 即 H0: p12vs H1: p12 进行研究,进而得到有关假设检验问题 H0:=0 vs H1: 0 的结论。1 p 的 Bayes估计XB(n,p) ,x 为从 B(n,p) 中抽得的样本,我们取贝塔分布Be(12,12)作为 p 的先验分布,由共轭先验分布可知,这时 p 的后验分布仍为贝塔分布 Be(12+x,12+n-x) ,这
3、时 p 的后验期望估计 E=12+x1+n ,由此可得=ln(12+x12+n-x) 。2 p 的 Bayes假设检验XB(n,p) ,x 为从 B(n,p) 中抽得的样本,现考虑假设H0:p=12vs H1: p12。我们取 p 的先验密度为 (p)=0I12(p)+1g1(p) ,其中 I12(p) 为 p=12 的示性函数, 1=1-0 ,g1(p) 为贝塔分布 Be(12,12) 的密度函数。x 对 g1(p)的边缘密度为:m1(x)=(1)(12)(12)JF(Z10Cxnpx(1-p)n-xJF)p-12(1-p)-12dp=Cxn(x+12)(n-x+12)(12)(12)(n+
4、1) ,于是贝叶斯因子为:B(x)= P(x|p0)m1(x)= (12)n(12)(12)(n+1)(x+12)(n-x+12)=n!x!(n-x)!(2x)!2(n-x)!,后验机会比为 a0a1= 0 P(x|p0)1m1(x)=0n!x!(n-x)!1(2x)!2(n-x)! 。当后验机会比a0a11时,接受 H0:p=12 ,即接受 H0:=0 ;当 a0a11 时,接受 H1:p12 ,即接受 H1:0 ;当 a0a11 时不宜作判断,尚需进一步抽样或收集先验信息。3 例题例:为探讨软组织肉瘤与接触苯氧乙酸或氯粉的关系,某单位做了一项 病例 对照研究,数据如表 2所示。表 2 软组
5、织肉瘤与接触苯氧乙酸或氯粉的关系对照病 由前面的讨论可知:(1)p 的 Bayes估计为E=12+x1+n=12+161+20=16.521,=ln16.54.51.2993 ,条件 Logistic回归方程为 logitP=1.2993x 。(2)取 0=12 ,在本例中 n=20,x=16 ,则后验机会比为 a0a1= 0n!x!(n-x)!1(2x)!2(n-x)!=20!16!4!32!8!=1.151510-71 ,应接受 H1:p12 ,即接受H1:0 。条件 Logistic 回归方程 logitP=1.2993x 有统计学意义。【参考文献】1 茆诗松. 贝叶斯统计. 北京:中国统计出版社,1999,1118.2 刘仁权. SPSS统计软件. 北京:中国中医药出版社,2007,130132.3 茆诗松,王静龙,濮晓龙. 高等数理统计. 北京:高等教育出版社 施普林格出版社,1998,1011.4 陈峰. 医用多元统计分析方法. 北京:中国统计出版社,2000,83111.