1、二项分布及其应用,内容提纲,二项分布的概念及应用条件二项分布的性质二项分布的特点二项分布的应用,举例:设小白鼠接受一定剂量的某种毒物染毒后死亡率为80%。若每组各用3只小白鼠(甲、乙、丙)接受该种毒物染毒,观察各组小白鼠的存亡情况。,一、二项分布的概念及应用条件,概率的乘法原理:几个相互独立的事件同时发生的概率等于各事件发生概率的乘积。概率的加法原理:几个互不相容的事件至少发生其一的概率等于各事件发生概率的和。,3只小白鼠存亡的排列和组合方式及其概率的计算,该例题中各种组合的概率恰好等于该二项式展开式的各项,所以将n次这种只具有两种互相对立结果中一种的随机实验成功次数的概率分布称为二项分布。,
2、该例题中各种组合的概率恰好等于该二项式展开式的各项,所以将n次这种只具有两种互相对立结果中一种的随机实验成功次数的概率分布称为二项分布。,例. 求前例中三只小白鼠死亡2只的概率。,一、二项分布的概念及应用条件,1、概念:若试验 E 只有两种相互对立的结果(A及 ),并且 , , 把 E 独立地重复 n 次的试验称为 n 重贝努里试验(Bernoulli trial)。 n 重贝努里试验中事件A发生的次数 x 所服从的分布即为二项分布(binomial distribution),记为 x B( , n )。 例 抛硬币(正/反),患者治疗后的结局(治愈/未愈),实验动物染毒后结局(生存/死亡)
3、,。,2、应用条件: n次试验相互独立 ( n 个观察单位相互独立)。 每次试验只有两种可能结果中的某一种(适用 于二分类资料)。 每次试验发生某一种结果的概率 固定不变 (要求各观察单位同质)。,一、二项分布的概念及应用条件,设从概率为的总体中随机抽取样本量为n的样本,每个样本的事件发生数为x,则 x B(,n)。可以证明:若用相对数表示,即样本率的均数和标准差分别为:,二、二项分布的性质(一)均数和标准差,率的标准误(standard error of rate):,(理论值),(实际值),(二)二项分布的累计概率从阳性率为 的总体中随机抽取n个观察单位,则(1)最多有k例阳性的概率为 (
4、2)最少有k例阳性的概率为,(三)二项分布的图形,x,n=10, =0.5,x,n=20, =0.5,n=30, =0.5,n=5, =0.3,n=10, =0.3,n=20, =0.3,n=50, =0.3,=0.2, n=50,=0.2, n=20,(四)二项分布的特点,1、当 时,无论 n大小,其图形均呈对称分布;2、当 ,且n小时 呈偏态分布;随n不断增大,逐渐趋于对称分布;当 时,逼近正态分布。 实际工作中,只要n足够大,与1- 均不太小时(通常规定 且 与 时),可看作近似正态分布,即 或,二项分布的正态近似示意图,二项分布的累计概率:,k1,k2,三、二项分布的应用(一)估计总体
5、率的可信区间,1、率的抽样误差 (理论值) (估计值)2、总体率的区间估计,2、总体率的区间估计,(1)查表法样本量较小时(n50)例3.6 某医院皮肤科医师用某种药物治疗20名系统性红斑狼疮患者,其中8人近期有效,求该法近期有效率的95%可信区间。用n=20和x=8查附表7.2百分率的可信区间得该法近期有效率的95%可信区间为19%64%。由于附表7百分率的可信区间中值只列出了x n/2的部分,当xn/2时,应以n -x查表,再从100中减去查得的数值即为所求可信区间。,三、二项分布的应用,2、总体率的区间估计,(2)正态近似法当样本含量足够大,且样本率p和 1-p均不太小,一般 np与n(
6、1-p)均大于5时,样本率的抽样分布近似正态分布,即此时, 总体率的可信区间可按下式进行估计:其中,三、二项分布的应用,三、二项分布的应用(二)假设检验,1、样本率与已知总体率的比较:(1)直接计算概率法:例1 根据以往长期的实践,证明某常用药的治愈率为65%。现在某种新药的临床试验中,随机观察了10名用该新药的患者,治愈8人。问该新药的疗效是否比传统的常用药好?,(1)建立假设,确定检验水准。 H0: = 0,即新药治愈率与传统药物相同 H1: 0,即新药治愈率高于传统药物 = 0.05(2)根据二项分布的分布规律,计算 P 值。,H0成立时,随机抽查的10人中治愈人数x 的分布,(3) 做
7、出推断结论。本例P 0.05,按=0. 05的检验水准不拒绝H0,尚不能认为新药疗效较传统药物疗效好。,例2 据以往经验,新生儿染色体异常率一般为1,某医生观察了当地400名新生儿,发现有1例染色体异常,问该地新生儿染色体异常率是否低于一般?,H0成立时, 400名新生儿中染色体异常例数的概率分布,(1)建立检验假设,确定检验水准 H0: = 0,即该地新生儿染色体异常率不低于一般 H1: 0.05,按 =0.05检验水准不拒绝H0,尚 不能认为该地新生儿染色体异常率低于一般。,1、样本率与已知总体率的比较:,(2) 正态近似法: 当 n0 和 n(1-0) 均大于5时, 可用正态近似法, 按
8、下式计算检验统计量u值。 或,例3 据报道,某常规疗法对某种疾病的治愈率为65%。现某医生用中西医结合疗法治疗了100例该病患者,治愈了80人。问该中西医结合疗法的疗效是否比常规疗法好?,当H0成立时, 100例患者中治愈人数的概率分布,(1)建立检验假设,确定检验水准 H0: = 0,即该种中西医结合疗法疗效与常规疗法相同 H1: 0,即该种中西医结合疗法疗效好于常规疗法 = 0.05 (2) 计算检验统计量 。本例, 0 =0.65,n=100, x=80 。 (3) 确定P值,做出推断结论。 查表得, 0.0005P 0,即老年胃溃疡患者胃出血发生率高于一般患者 = 0.05 (2) 计
9、算检验统计量 。 (3) 确定P值 , 做出推断结论。查表得, P0.05,按 =0.05检验水准不拒绝H0,尚不能认为该地新生儿染色体异常率与一般人群不同。,例3* 据报道,某常规疗法对某种疾病的治愈率为65%。现某医生为了解一种中西医结合疗法的疗效,用该中西医结合疗法治疗了100例该病患者,治愈了80人。问该中西医结合疗法的疗效是否与常规疗法相同?,建立检验假设,确定检验水准: H0: = 0,即中西医结合疗法与常规疗法疗效相同 H1: 0,即中西医结合疗法与常规疗法疗效不同 = 0.05,若H0成立时, 100人中治愈人数 xB(0.65,100),其中p(80)=0.00044,比其更
10、极端的情形包括x80和x49。 按正态近似法对应的概率分别为P(u3.14)和P(u -3.14)。故P=(u1)+1-(u2)=2(u1)=0.00168。P0.05,故按=0.05水准拒绝H0, 接受H1,认为中西医结合疗法与常规疗法不同。,(1)建立检验假设,确定检验水准 H0: = 0,即该种中西医结合疗法疗效与常规疗法相同 H1: 0,即该种中西医结合疗法疗效好于常规疗法 = 0.05 (2) 计算检验统计量 。本例, 0 =0.65,n=100, x=80 。 (3) 确定P值,做出推断结论。 查表得, 0.001P50,n250且n1p1, n1(1-p1), n2p2, n2(
11、1-p2)均大于5) 时,可用u检验: 其中,p1, p2 分别为两样本率, pc为两样本的合并率:,2、两样本率的比较,例5 为研究高血压病的遗传度, 某医师进行了高血压子代患病率调查。其中父母双亲有一方患高血压者调查了205人,其中高血压患者101人;父母双亲均患高血压者调查了153人,其中高血压患者112人。问双亲中只有一方患高血压与双亲均患高血压的子代中,高血压患病率是否相同?,(1)建立检验假设,确定检验水准 H0:1 = 2,即两组人群中子代患病率相同 H1: 1 2,即两组人群中子代患病率不同 = 0.05 (2)计算检验统计量 。 本例, p1=101/205=0.49268,
12、 p2=112/153=0.73203, pc =(101+112)/(205+153)=0.59497 。 (3) 确定P值, 做出推断结论。 查表得P0.0005,按 = 0.05水准拒绝H0, 接受H1,认为两组子代患病率不同,父母双亲均患病者子代高血压患病率高于单亲患病者。,例6.3 某研究者在某地区随机抽取10岁儿童100人,20岁青年120人,检查发现10岁儿童中有70人患龋齿,20岁青年中有60人患龋齿,问该地区10岁儿童与20岁青年患龋齿率是否相等?,2、两样本率的比较,(1)建立检验假设,确定检验水准 H0:1 = 2,即两组人群龋患率相同 H1: 1 2,即两组人群龋患率不同 = 0.05 (2) 计算检验统计量 。 本例, p1=70/100=0.70, p2=60/120=0.50, pc =(70+60)/(100+120)=0.5909 。 (3) 确定P值, 做出推断结论。 查表得P50 且 np5 和n(1-p) 5 )(二)样本率与已知总体率比较的假设检验 1、直接计算概率法 2、正态近似法(n50 且 n05 和n(1-0) 5 )(三)两大样本率比较的假设检验 正态近似法 n1, n250 且 n1p15 ,n1(1-p1) 5 and n2p25 ,n2(1-p2) 5,