1、医学统计学(07)x2检验,季聪华2012.11.15,中华医学杂志对来稿统计学处理的有关要求,卡方检验(chi-square test),2检验是现代统计学的创始人之一,英国人Karl . Pearson于1900年提出的一种具有广泛用途的统计方法。可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。,X2分布,卡方分布图形特征*,卡方分布的形状依赖于自由度 的大小:当自由度2时,曲线呈“L”型;随着 的增加,曲线逐渐趋于对称;当自由度 时,曲线逼近于正态曲线,卡方检验基本思想,用卡方值的大小来衡量实际频数和理论频数之间的吻合程度。在零假设H0 成立的条件下,实际频数与理论频
2、数相差不应该很大,即x2值不应该很大。若实际计算出的x2值较大,说明实际频数和理论频数吻合程度小,相差大,则有理由怀疑H0的真实性,从而拒绝H0,接受H1。,x2检验,单个样本构成比的x2检验拟合优度检验独立样本四格表的x2检验行列的x2检验配对设计分类资料的x2检验多维分类资料的x2检验,x2检验,单个样本构成比的x2检验拟合优度检验独立样本四格表的x2检验行列的x2检验配对设计分类资料的x2检验多维分类资料的x2检验,在中医药科研中,经常遇到同一个样本中两个或多个构成比比较的问题,在满足卡方检验的要求条件下,可用卡方检验来分析实际频数的比率是否符合理论比率。,【例1】为探索高血压患者中医证
3、型构成,调查原发性高血压患者3578例,中医证型构成见表。问原发性高血压患者中医证型内部构成是否相同?,A,T,X2=392.514V=5-1=4P=1-CDF.CHISQ(392.514,4)=0.000,SPSS软件操作,第1步:定义变量,第2步:输入原始数据,第3步:定义频数,选择数据加权个案例数加权个案(频数变量),第4步:x2检验,选择分析非参数检验卡方中医证型检验变量列表,第5步:结果解读,结果解读:x2=392.514,p=0.000,说明原发性高血压患者中医证型内部构成不相同。,注意事项,进行拟合优度 x2 检验,一般要求有足够的样本含量,理论频数不小于 5 。理论频数小于 5
4、 时,需要合并计算。,x2检验,单个样本构成比的x2检验独立样本四格表的x2检验行列的x2检验配对设计分类资料的x2检验多维分类资料的x2检验,四格表的卡方检验,也是通过计算代表实际频数A与理论频数T之间的吻合程度的卡方值来进行检验的。理论频数T采用两组的合并情况来计算。,【例2】某医院把慢性支气管炎患者376名,随机分为2组,分别用中西医结合法和西医法治疗,结果见表。问两种疗法治疗慢性支气管炎病人的治愈率是否有差别?,理论值T的计算,345/376(总的治愈率)*276=253.24,276-253.24=22.76,345/376(总的治愈率)*100=91.76,100-91.76=8.
5、24,卡方值的计算,卡方值的影响因素:1、格子数2、实测值与理论值的差距,专用公式的推导,T11=(a+c)/(a+b+c+d)*(a+b),T12=(b+d)/(a+b+c+d)*(a+b),T21=(a+c)/(a+b+c+d)*(c+d),T22=(b+d)/(a+b+c+d)*(c+d),专用公式的推导,SPSS软件操作,第1步:定义变量,第2步:输入原始数据,第3步:定义频数,选择数据加权个案频数加权个案(频数变量),第4步:x2检验(1),选择分析交叉表交叉表对话框:组别和疗效分别进入行和列,输出4种卡方检验结果:1、pearson卡方2、卡方值的校正值3、似然比卡方,一般用于对数
6、线性模型。4、fisher的精确检验,输出2种相关系数:1、pearson相关系数2、spearman相关系数,列联系数:分析行与列之间的关联程度,Kappa:一致性检验,风险:计算相对危险度(RR)和比数比(OR)。,McNemar:优势性检验。,第4步:x2检验(2),选择统计量按钮在交叉表:统计量对话框:勾上卡方,第4步:x2检验(3),选择单元格按钮在交叉表:单元显示对话框:勾上观察值、百分比:行、列,第5步:结果解读(1),结果解读:中西医组的治愈率为98.2%,西医组的治愈率为74.0%。,第5步:结果解读(2),结果解读:x2=56.772,p=0.000两种疗法治疗慢性支气管炎
7、病人的治愈率的差别有统计学意义,四格表x2检验结果的选择,1)当n40,所有理论值 5时,用pearson卡方检验;或者确切概率法。2)当n40,但有理论频数1理论值5时,用连续校正的卡方检验;或者确切概率法。3) n40或有理论值1,或P时,用确切概率法。,卡方检验的校正公式,【例3】某中医院比较两药治疗某病的效果,所得结果见表。问甲乙两药疗效有无差别?,校正公式,SPSS软件操作,第1步:定义变量,第2步:输入原始数据,第3步:定义频数,选择数据加权个案频数加权个案(频数变量),第4步:x2检验(1),选择分析交叉表交叉表对话框:组别和疗效分别进入行和列,第4步:x2检验(2),选择统计量
8、按钮在交叉表:统计量对话框:勾上卡方,第4步:x2检验(3),选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行,第5步:结果解读(1),结果解读:甲药组的有效率为92.9%,乙药组的有效率为64.3%。,第5步:结果解读(2),结果解读:有2个格子的期望值小于5,不符合卡方检验的条件。,第5步:结果解读(3),结果解读:四格表中有期望值小于5,选连续校正的卡方。x2=3.621,p=0.057?P(exact)=0.031?,【例4】某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表。问两组新生儿的HB
9、V总体感染率有无差别?,SPSS软件操作,第1步:定义变量,第2步:输入原始数据,第3步:定义频数,选择数据加权个案频数加权个案(频数变量),第4步:x2检验(1),选择分析交叉表交叉表对话框:组别和感染结果分别进入行和列,第4步:x2检验(2),选择统计量按钮在交叉表:统计量对话框:勾上卡方,第4步:x2检验(3),选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行,第5步:结果解读(1),结果解读:预防注射组的感染阳性率为4/22,非预防组的感染阳性率为5/11。,第5步:结果解读(2),结果解读:四格表中有期望值小于5,总例数小于40。,第5步:结果解读(3),结果解
10、读:选Fisher的精确检验p(exact)=0.121,x2检验,单个样本构成比的x2检验独立样本四格表的x2检验行列的x2检验配对设计分类资料的x2检验多维分类资料的x2检验,行列卡方检验计算公式,n为总例数;R和C分别为行数和列数;A为第R行、第C列位置上的实际频数;nR为实际频数所在行的行合计;nC为实际频数所在列的列合计。,【例5】某中医师将某病患者随机分为三组,分别用新药、传统药物和安慰剂治疗,结果见表。问三种方法治疗该病的有效率是否有差别?,A,nC,nR,SPSS软件操作,第1步:定义变量,第2步:输入原始数据,第3步:定义频数,选择数据加权个案频数加权个案(频数变量),第4步
11、:x2检验(1),选择分析交叉表交叉表对话框:组别和疗效分别进入行和列,第4步:x2检验(2),选择统计量按钮在交叉表:统计量对话框:勾上卡方,第4步:x2检验(3),选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行,第5步:结果解读(1),结果解读:新药组的有效率为88.9%,传统药物组的有效率为86.7%,安慰剂组的有效率为70.9%。,第5步:结果解读(2),结果解读:x2=13.238,p=0.001,进一步的两两比较,P0.017才有统计学意义!,【例6】某中医院用三种治疗方法治疗413例糖尿病患者,资料见表。为避免中医不同证型对疗效比较的影响,分析3种疗法治疗
12、的病人按3种中医分型的构成比有无差别?,SPSS软件操作,第1步:定义变量,第2步:输入原始数据,第3步:定义频数,选择数据加权个案频数加权个案(频数变量),第4步:x2检验(1),选择分析交叉表交叉表对话框:组别和中医分型分别进入行和列,第4步:x2检验(2),选择统计量按钮在交叉表:统计量对话框:勾上卡方,第4步:x2检验(3),选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行,第5步:结果解读(1),结果解读:各组的中医分型构成比。,第5步:结果解读(2),结果解读:x2=4.020,p=0.403,【例7】某医院肝胆外科在手术中,观察了222例胆结石患者,其发病部
13、位与结石类型的资料见表,分析其发病部位与结石类型间有无关系?,行变量和列变量均为无序分类变量。可分析行、列两变量之间有无关联,关联的密切程度。可进行多个样本率或构成比的比较。,关联性分析,列联系数的意义|rp|0.4,关联程度低0.4|rp|=40X2=(|b-c|-1)2/(b+c) n40,一致性检验Kappa分析,SPSS软件操作,第1步:定义变量,第2步:输入原始数据,第3步:定义频数,选择数据加权个案频数加权个案(频数变量),第4步:x2检验(1),选择分析交叉表交叉表对话框:甲法和乙法分别进入行和列,第4步:x2检验(2),选择统计量按钮在交叉表:统计量对话框:勾上卡方、相关系数、
14、Kappa、McNemar,第4步:x2检验(3),选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行、总计,第5步:结果解读(1),结果解读:两种方法交叉的例数关系。甲法阳性率65.0%,乙法阳性率48.3%。,第5步:结果解读(2),结果解读:配对设计选用优势性检验结果,p=0.031。甲组的阳性率高于乙组的阳性率。,第5步:结果解读(3),结果解读:关联性rp=0.395,p=0.001 一致性kappa=0.406,p=0.004,Kappa的意义0.02 差0.02 轻微0.20 尚可0.40中等0.60好0.80-1.00 几乎完全一致,【例9】下表为外侧半月板
15、撕裂的膝关节镜诊断(金标准)与MRI(核磁共振成像)诊断的结果,试对两种诊断方法进行分析。,SPSS软件操作,第1步:定义变量,第2步:输入原始数据,第3步:定义频数,选择数据加权个案频数加权个案(频数变量),第4步:x2检验(1),选择分析交叉表交叉表对话框:MRI诊断和关节镜诊断分别进入行和列,第4步:x2检验(2),选择统计量按钮在交叉表:统计量对话框:勾上卡方、相关系数、Kappa、McNemar,第4步:x2检验(3),选择单元格按钮在交叉表:单元显示对话框:勾上观察值、期望值、百分比:行、总计,第5步:结果解读(1),结果解读:两种方法交互的例数关系。,第5步:结果解读(2),结果
16、解读:优势性检验p=0.268。两种诊断方法的诊断结果差异无统计学意义。,第5步:结果解读(3),结果解读:关联性rp=0.580,p=0.000 一致性kappa=0.515,p=0.000,x2检验,单个样本构成比的x2检验独立样本四格表的x2检验独立样本多个率和构成比的x2检验配对设计分类资料的x2检验多维分类资料的x2检验,【例10】某药业集团研制了一种治疗慢性皮炎的新药,为了解该药的药物疗效,同某种常用药物的疗效作了比较,资料如表。问该新药与常用药物的疗效有无差异?,SPSS软件操作,第1步:定义变量,第2步:输入原始数据,第3步:定义频数,选择数据加权个案频数加权个案(频数变量),
17、第4步:x2检验(1),选择分析交叉表交叉表对话框:组别、疗效和中心分别进入行、列和层1的1,第4步:x2检验(2),选择统计量按钮在交叉表:统计量对话框:勾上卡方及CMH统计量。,第4步:x2检验(3),选择单元格按钮在交叉表:单元显示对话框:勾上观察值、百分比:行、列,第5步:结果解读(1),结果解读:每个中心的描述。,第5步:结果解读(2),结果解读:每个中心的卡方检验。,第5步:结果解读(3),结果解读:中心效应x2=1.642,p=0.650,第5步:结果解读(4),结果解读:x2=5.531,p=0.019考虑分层(多中心)混杂因素影响后的卡方值。,第5步:结果解读(5),结果解读:如果是病例对照研究,或者队列研究,OR值及其95%CI。,谢 谢!,