二项分布及其应用.ppt

上传人:坚持 文档编号:4127772 上传时间:2019-09-28 格式:PPT 页数:46 大小:413.50KB
下载 相关 举报
二项分布及其应用.ppt_第1页
第1页 / 共46页
二项分布及其应用.ppt_第2页
第2页 / 共46页
二项分布及其应用.ppt_第3页
第3页 / 共46页
二项分布及其应用.ppt_第4页
第4页 / 共46页
二项分布及其应用.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

1、第五章第二节 二项分布 ( p67) 在医学领域的随机事件中,最简单的是只有两种互斥可能结果 随机事件,称为二项分类变量( dichotomous variable),如接受 治疗后的结果是有效、还是无效;某种化验的结果是阳性、还是阴 性,手术后是生存、还是死亡。对这类问题的研究,不仅要确定 2个 可能出现的随机事件的概率,有时还要计算在独立、重复地进行 N 次相同的观察下,某一事件出现 k 次的概率。 二项分布( binomial distribution)就是对这类只具有两种 互斥结果的离散型随机事件的规律性进行描述的一种概率分布。 二项分布的概念 瑞士数学家 James Bernoull

2、i 对只有两种可能结果的随机试验进 行研究,当成功的概率( )是恒定的,且各次试验相互独立,这种 试验在统计学上称为贝努里试验( Bernoulli trial)。 N 次独立、重复的 Bernoulli试验也就称为 n重 Bernoulli试验 。 满足以下条件: 1、每次试验只有两个互斥的一种结果,记为 A和 ,所以 如阳性或阴性,生存或死亡等,属于两分类资料。 2独立是指各次试验出现的结果之间是无关的。 3重复是指每次试验的条件不变,保证了在各次试验中结果 发生的概率不变。 二项分布描述的是在 n 次贝努里试验中, “结果 A出现 k次 ” 这一随机事件的取值及其概率。 如果用随机变量

3、X( X=0,1, ,n)表示在 Bernoulli试验中, 结果 A出现的次数。则 X服从 二项分布,记为 x服从 , 概率可用下面的二项分布概率公式来描述: 例题: 已知用某种药物治疗某一非传染疾病的有效率为 60,今用 该药治疗该病患者 20人,试计算其中 12人有效的概率。 解: 根据题意,以 X表示 “所用药物治疗该病有效的人数 ”,X服从二 项分布,已知 n=20,=0.6,x=12。 二项分布的特征 1、 二项分布的图形 已知 和 n,就能按公式计算 X=0, 1, , n时的 P( X)值。以 X 为横坐标,以 P( X)为纵坐标作图,即可绘出二项分布的图形,二项 分布的形状取

4、决于 和 n 的大小,高峰在 =n 处。 当 接近 0.5时,图形是对称的; 离 0.5愈远,对称性愈差,但随着 n 的增大,分布趋于对称。 当 n 时,只要 不太靠近 0或 1,特别是当 nP和 n(1 P)都大于 5时,二项分布近似于正态分布。 =0.5时 ,不同 n值对应的二项分布 = 0.3 时 , 不同 n 值对应的二项分布 2、二 项分布的均数与标准差 二项分布的总体均数: 方差: 标准差: 如果将出现阳性结果的频率记为 p , p 的取值为 则 p的总体均数为: 标准差为: p 是样本率的标准误的理论值,当 未知时,常用样本率 p作 为 的估计值, 由以上得知,样本率的标准差即率

5、的标准误,可以用来描述 样本率的抽样误差,率的标准误越小,则说明率的抽样误差越小 。 总体均数: 总体标准差: 总体率的标准误 二项分布的累计概率( cumulative probability) 常用的有左侧累计和右侧累计两种方法。从阳性率为 的总 体中随机抽取含量为 n的样本,则 ( 1)最多有 k 例阳性的概率 ( 2)最少有 k 例阳性的概率 其中, X 0,1,2, ,k, ,n。 一、总体率的区间估计 总体率的估计也有点(值)估计和区间估计,点 估计是简单地用样本率来估计总体率;区间估计是求 出总体率的可能范围。 样本率的理论分布和样本含量 n、阳性率 p的大小 有关,所以需要根据

6、 n 和 p 的大小不同,分别选用 下列两种方法: 二项分布的应用 (一)查表法 当样本含量 n较小,如 n50 ,特别是 p很接近于 0或 1 时,按二项分布的原理估计总体率的可信区间。因为其 计算过程较复杂,统计学家已经编制了百分率的可信区 间(附表),可直接根据样本含量 n 和阳性数 X 查出总 体率的可信区间。 例题 从某学校随机抽取 26名学生,发现有 4名感 染沙眼,试求该校沙眼感染率 95的可信区间。 本例 n=26, X=4,查附表 7的可信度为 95的可信 区间为 (0.04, 0.35),即 (4, 35 )。 见 p438 (二)正态近似法 当样本含量 n足够大,且样本率

7、 p 或 1-p 均不太 小,如 np 与 n( 1-p)均大于 5时,样本率 p 的抽 样分布近似正态分布,总体率 的可信区间可按下 式进行估计。 例题 某研究者测得, 158名正常男性 HBgAg,其阳性率为 15.35%,试计算出样本率的抽样误差及总体阳性率的 95% 可信区间。 解:本例 p 0.1535 n 158 代入 总体率 95 % 可信区间为: p 1.96S p = 0.1535 1.960.0287 =0.0972 0.2097 即: 9.72% 20.97% 二、样本率与总体率比较 比较目的:推断样本率所代表的总体率 与某已 知总体率 0 是否相等。 1直接概率法:当

8、或 时 ( 1)检验假设 ( 2)直接计算概率 P 值 当 时, 当 时, ( 3)做出推断结论 当 ,在 =0.05检验水准拒绝 ,接受 ,可以认 为两总体率不同。 当 ,在 =0.05检验水准不拒绝 ,尚不能认为两总 体率不同。 抗生素治疗小儿上呼吸道感染、支气管炎,有效率为 85%。问在 5人中 ,二人有效的概率是多少? 甲 乙 丙 丁 戊 无效 无效 无效 无效 有效 0.15 0.15 0.15 0.15 0.85 无效 无效 无效 有效 无效 0.15 0.15 0.15 0.85 0.15 无效 无效 有效 无效 无效 0.15 0.15 0.85 0.15 0.15 无效 有效

9、 无效 无效 无效 0.15 0.85 0.15 0.15 0.15 有效 无效 无效 无效 无效 0.85 0.15 0.15 0.15 0.15 5人中有 0, 1, 2, 3, 4, 5 人有效的概率分别为二项展开式中的各项 。有效人数每种组合情况概率值 有效人数 每种组合情况 概率值 p(x) 0 0.000075938 1 0.002151563 2 0.024384375 3 0.138178125 4 0.391504687 5 0.443705312 合计 1.000000000 上式中最多 2 例有效的概率为: P(X2)=0.000075938+0.002151563+0.

10、024384375=0.026611876 上式中至少有 2例有效的概率为: P(X2)=0.024384375+0.138178125+0.391504687+0.443705312 =0.997772499 2、正态近似法: 当 , 时 若不太靠近 0或 1时,当样本含量 n 足够大,样本率的抽样分布逼近正态分布,可用 u 检验计 算其样本检验统计量。 公式为 P为样本率, 0为已知总体率(常为理论值或标准 值), n为样本含量。 例题 一般人群中精神发育不全者约为 3 ,今调查有亲 缘血统婚配关系的后代 25000人,有精神发育不全者 123 人,问有亲缘血统婚配关系的后代中精神发育不全

11、的发 生率是高于一般人群? H0: = 0 已知 0 = 0.003 P20时,依据 Poisson分布近似正态分布的原理,可 以应用 Z检验对其总体均数进行推断。 检验假设 当 ( 1)当两样本观测单位数相等时,检验统计量为 例题 甲、乙两检验师分别观察 15名正常人末梢血嗜碱性白细胞数 量。每张血片均观察 200个视野。结果甲计数到嗜碱性白细胞 26个 ,乙计数到 29个。试问两位检验师检查结果是否一致? 1.建立检验假设 2.计算统计量 3.确定 P 值和作推断 所以 P 0.5,按 =0.05水准不能拒绝 H0。尚不能认 为两检验师检查结果有差异。 ( 2)当两样本观测单位数不等时,检验统计量为 分别为两样本均数, n1与 n2是观测单位数不等 因工艺改革前后观测单位数不等,故分别计算其均数。 , n1=3 , n2=2 显然, Z 2.723 1.96, P 0.05,于是在 =0.05的 水平上拒绝 H0。可以认为工艺改革前后粉尘浓度不同,改 革工艺后粉尘浓度较低。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。