1、第二节分类变量资料的统计推断三、 2 检验 ( chi-square test)u推断两个总体率或构成比之间有无差别;u推断多个总体率或构成比之间有无差别 ;u配对资料比较的 2 检验u推断两个分类变量之间有无关联性以及频数分布的拟和优度检验。 2 检验的基本思想A、 B两种疗法的疗效比较设 H0: 1= 2, H1: 1 2, =0.05若 H0成立 ,两组合计治愈率 =20.0%未治愈率 =80.0%疗法 治愈人数 未愈人数 合计 治愈率(%)A 11(20) 89(80) 100 11.0B 31(22) 79(88) 110 28.0合计 42 168 210 20.0理论上:A组治愈
2、例数为 100(42/210)=20未愈例数为 100(168/210)=80B组治愈例数为 110(42/210)=22未愈例数为 110(168/210)=88A为实际频数 (actual frequency)T为理论频数 (theoretical frequency)u 2 检验的基本思想 2值反映了实际频数与理论频数的吻合程度 ,若检验假设 H0成立 ,实际频数与理论频数的差值会小 ,则 2值也会小 ;反之 ,若 H0不成立 ,实际频数与理论频数的差值会大,则 2值也会大 ; 2值大到超过某个界值时 ,则拒绝 H0,接受 H1。但因 2值大小还取决于自由度的大小, 因此 ,根据样本计算得到的 2值应与 比较 ,当 2 时 , P ,则拒绝 H0,接受 H1;当 2 时 ,P , 则不拒绝 H0。四格表资料的 2检验u 2检验基本公式u四格表资料 2检验专用公式应用条件: n40 且所有 T5 u四格表资料 2检验的校正公式应用条件: n40 但有 1T 5u四格表 Fisher确切概率法:应用条件: n 40,或 T 1 H0: 1= 2, H1: 1 2,=0.05=(2-1)(2-1)=1,查 2界值表得 2 ,得 P0.005。 按 =0.05水准,拒绝 H0,接受 H1,差异有统计学意义。 B疗法治愈率高于 A疗法。