1、某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了 515个成年人,其中吸烟者 220人,不吸烟者 295人,调查结果是:吸烟的 220人中 37人患 病 , 183人不患 病 ;不吸烟的295人中 21人患 病 , 274人不患 病 。根据这些数据能否断定:患 肺癌 与吸烟有关吗?患病 不患病 总计吸烟 37 183 220不吸烟 21 274 295总计 58 457 515为了研究这个问题,我们将上述问题用下表表示:列 22 联表在不吸烟者中患病的比重是 在吸烟者中患病的比重是 7.12%16.82%上述结论能什么吸烟与患病有关吗?能有多大把握认为吸烟与患病有关呢?
2、患病 不患病 总计吸烟 a b a+b不吸烟 c d c+d总计 a+c b+d a+b+c+d列出 22 列联表 假设 H0: 吸烟和患病 之间没有关系 即 H0: P(AB) P(A)P(B) 其中 A为某人吸烟, B为某人患病 设 n a b c d 则 P(A) P(B) 故 P(AB) 吸烟且患病人数吸烟但未患病人数不吸烟但患病人数不吸烟且未患病人数怎样描述实际观测值与估计值的差异呢?统计学中采用即独立性检验第一步: H0: 吸烟 和 患病 之间没有关系 通过数据和图表分析,得到结论是: 吸烟与患病有关结论的可靠程度如何? 患病 不患病 总计吸烟 a b a+b不吸烟 c d c+d
3、总计 a+c b+d a+b+c+d第二步:列出 22 列联表 用 2统计量研究这类问题的方法步骤第三步:引入一个随机变量: 卡方统计量第四步:查对临界值表,作出判断。P(x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828P(x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001x0 0.455 0.708 1.323 2.072 2.706 3.
4、841 5.024 6.635 7.879 10.8280.1%把握认为 A与 B无关1%把握认为A与 B无关99.9%把握认为 A与 B有关99%把握认为 A与 B有关90%把握认为 A与 B有关10%把握认为A与 B无关没有充分的依据显示 A与 B有关,但也不能显示 A与 B无关例如独立性检验通过公式计算患病 不患病 总计吸烟 49 2099 2148不吸烟 42 7775 7817总计 91 9874 9965H0: 吸烟 和 患病 之间没有关系解:已知在 成立的情况下,故有 99.9%的把握认为 H0不 成立,即有 99.9%的把握认为 “ 患病与吸烟有关系 ” 。即在 成立的情况下, 大于 10.828概率非常小,近似为 0.001现在的 =56.632的观测值远大于 10.828,出现这样的观测值的概率不超过 0.001。