1、第六章 几种常见离散型变量的分布和应用 宁夏医科大学公共卫生学院流行病与卫生统计学系主讲人 李吴萍 教授Distribution and Application ofDiscrete Data一、二项分布条件与性质 (二分类变量)一)、 Bernoulli试验在医学科研中,很多情况可归纳为观察随机试验中某事件是否发生。如观察某药物是否有效;观察某指标的化验结果是否为阳性。这些试验的共同的特征是一次试验只有两种独立的结果:事件发生或事件不发生,这种试验称为 Bernoulli试验(或成败试验)。第一节 二项分布Bernoulli试验序列 满足以下三个条件的 n 次试验构成的序列称为 Bernou
2、lli试验序列。1) 各观察单位只能是具有相互对立的一种结果 ,如阳性或阴性,生存和死亡等。2) 已知发生某一结果(如阳性)的概率为 ,其对立结果的概率为 1- 。实际工作中要求 是从大量观察中获取的比较稳定的数值。3) n个观察单位结果互相独立 ,即每个观察结果不会影响到其它观察单位结果。例 6-1 设小白鼠接受某种毒物一定剂量时,其死亡率为 80%,对于每只小白鼠来说,其死亡概率为 0.8,生存概率为 0.2。现对 3只小白鼠进行实验观察。结果见下表满足 Bernoulli试验序列三个条件:一、二分类资料;二、因每次实验条件不变,每只动物的死亡概率是相同的;三、每只动物的生与死不影响其它动
3、物。独立事件的乘法定理互不相容事件的加法定理其中 X=0, 1, 2 , n。 n, 是二 项 分布的两个参数 。 对于任何二项分布,总有 构成 Bernoulli试验序列的 n次实验中,事件A出现的次数 X的概率分布为:二项式展开各项就是每种组合的概率其一般表达式为:由于各观察单位是独立的,则从该总体中随机抽取 n例,其中恰有 x例是阳性的概率为二项式展开,记作 ,称为二项分布的概率函数,即两种累计方式:最多有 k例阳性概率最少有 k例阳性的概率二项分布的累计概率 ( cumulative probability)例 6.2 已知某地玉米的黄曲霉污染率近年为20%。 若抽取 10个样品作检查,求( 1)污染样品数不超过一个的概率。( 2)污染样品数在 8个以上的概率 。解:二 ) 二项分布的适用条件1. 每次试验只会发生两种对立的可能结果之一,即分别发生两种结果的概率之和恒等于 1;2. 每次试验产生某种结果(如 “ 阳性 ” )的概率 固定不变;3. 重复试验是相互独立的,即任何一次试验结果的出现不会影响其它试验结果出现的概率。