1、25生物统计学教案第三章 几种常见的概率分布律教学时间:3 学时教学方法:课堂板书讲授教学目的:重点掌握正态分布,掌握二项分布,了解泊松分布,中心极限定律。讲授难点:正态分布、二项分布3.1 二项分布(重点)3.1.1 二项分布的概率函数满足二项分布的条件:1、在一随机试验中,每次试验都有两种不同的结果。2、两种结果是互不相容的。3、每一种结果在每次试验中都有恒定的概率。4、试验间应是独立的。独立地将此试验重复 n 次,求在 n 此试验中,一种结果出现 x 次的概率是多少?例:从雌雄各半的 100 只动物中抽样,抽样共进行 10 次,问其中包括 3 只雄性动物的概率是多少?包括 3 只及 3
2、只以下的概率是多少?即求P( X3)和 P( X3)该例符合二项分布的条件。规定以下一组符号:n 试验次数x 在 n 次试验中事件 A 出现的次数 事件 A 发生的概率(每次试验都是恒定的)1 事件 发生的概率p(x) = x 的概率函数 P( X x)26(累积分布函数) F(x) = P( X x ) 上例中: n=10 x=3 =0.5 求 p(3) 和 F(3)。在一次抽样中抽到的结果为:mmmfffffff,它的概率为P(mmmfffffff)= 3(1-) 7抽到 3 雄 7 雌的数目相当于从 10 个元素中抽出 3 个元素的组合数对于任意 n 和 x 有以下通式: 1,0,12,
3、nxxnpCn上式称为二项分布的概率函数。该式正是二项展开式的第 x+1 项,因而产生“二项分布”这一名称。因为 (1)1,所以将 x0,1,2,3,代入二项分布概率函数,可以得出出现 0,1,2,3 只雄性动物的概率。P(0) 0.0009766 P(1) 0.0097656P(2) 0.0439453 P(3) 0.1171876抽到 3 只和 3 只以下雄性动物的概率为:F(3) P(0) P(1) P(2) P(3)0.17187513.1.2 服从二项分布的随机变量的特征数平均数: n 或 方差: 2 n(1-) 或 3.1.3 二项分布应用实例例 1 以杂合基因型 Wvwv 的小鼠
4、为父本,隐性纯合子小鼠 wvwv 为母本杂交(wv 波浪毛,Wv 直毛) ,后代两种基因型的数目应各占一半。实验只选每窝 8 只的,7103Cp10 nnxpn1227多于 8 只和少于 8 只的都淘汰。结果列在下表中。直毛后代数 观测频数( x) ( f) fx fx2 p(x) Np(x)0 0 0 0 0.003906 0.1249921 1 1 1 0.031250 1.0000002 2 4 8 0.109375 3.5000003 4 12 36 0.218750 7.0000004 12 48 192 0.273437 8.7499845 6 30 150 0.218750 7.
5、0000006 5 30 180 0.109375 3.5000007 2 14 98 0.031250 1.0000008 0 0 0 0.003906 0.124992总数 N32 139 665 0.999999 31.99968样本平均数、总体平均数;样本方差、总体方差如下:例 2 遗传学中单因子杂交 RRrr, F1代为 Rr, F1自交, F2基因型比符合二项分布。在 F2中 P( R)1/2, P( r)11/2, n2。展开二项式:21 9748.1321650.4218375.92 2 nNfxfxsnfxxrRr412141 212122 28对于两对因子, n4在为人类或
6、动物遗传学研究中,为了保证实验顺利完成,在制定试验计划时,首先要以指定概率求出所需样本含量 n。例 3 用棕色正常毛( bbRR)的家兔和黑色短毛( BBrr)兔杂交, F1代为黑色正常毛长的家兔( BbRr), F1代自交, F2代表型比为:9/16 B_R_ : 3/16B_rr : 3/16bbR_ : 1/16bbrr。问最少需要多少 F2代家兔,才能以 99的概率得到一个棕色短毛兔?答: n (15/16) n 0.01n(lg15lg16) lg0.01-0.02803n 2.00000n 71.43.2 泊松分布3.2.1 泊松分布的概率函数在二项分布中,当某事件出现的概率特别小
7、(0) ,而样本含量又很大( n)时,二项分布就变成泊松分布了。泊松分布是描述在一定空间、长度、面积、体积或一定时间间隔内,点子散布状况的理想化模型。泊松分布的概率函数为:3.2.2 服从泊松分布的随机变量的特征数泊松分布的平均数: 可见,泊松分布的平均数就是泊松分布概率函数中的 。泊松分布的方差: 2 1646416 2242121211 43344 ,21,0,!xexxp29概率函数中的 不但是它的平均数,而且是它的方差。3.2.3 泊松分布应用实例例 1 在麦田中,平均每 10m2有一株杂草,问每 100m2麦田中,有 0 株、1 株、2 株、杂草的概率是多少?解: 先求出每 100m
8、2麦田中,平均杂草数 100/10 10 株将 代入泊松分布的概率分布函数中,p(x) = 10x/x!e10, 即可求出 x 0,1,2, 时所相应的概率。结果如下:x 5 6 7 8 9 10 p(x) 0.0671 0.0631 0.0901 0.1126 0.1251 0.125111 12 13 14 150.1137 0.0948 0.0729 0.0521 0.0835例 2 绘制遗传连锁图时,制图函数是通过泊松分布推演出的。在一对同源染色体之间交换的出现是服从泊松分布的,将 x0 代入泊松分布的概率函数中,得出两基因座之间无交换出现的概率。两基因座之间至少出现一次交换的概率P(
9、x1) = 1 e- 。从遗传学理论可知,在两基因座之间大于等于 1 的任何有限次交换其重组频率恒等于 50。因此重组率解出两基因座之间的平均交换次数= ln(12RF )两基因座之间平均交换一次,其图距为 50m.u.,从而可以得出图距MD50ln(12RF)eep!0eRF12303.4 正态分布(重点)3.4.1 正态分布的密度函数和分布函数对于平均数是 ,标准差是 的正态分布,其密度函数为:正态分布密度函数的图象称为正态曲线正态分布曲线以符号 N(, 2)表示平均数为 ,标准差为 2的正态分布。随机变量 X 的值落在任意区间( a, b)内的概率累积分布函数3.4.2 标准正态分布当
10、0,1 时的正态分布称为标准正态分布,标准正态分布记为 N(0,1)。标准正态分布的密度函数为: 0,212 xexf x212xba aPabfxded dzedzfxXPxF xzx 221 ueuu,21231标准正态分布的分布曲线如下图标准正态分布曲线累积分布函数分布图如下:标准正态分布的累积分布曲线 标准正态分布有以下特性:1、在 u0 时 ( u)达到最大值。2、当 u 不论向哪个方向远离 0 时,( u)的值都减小。3、曲线两侧对称。4、曲线在 u1 和 u1 处有两个拐点。5、曲线与横轴所夹面积等于 1。6、累积分布曲线围绕点(0,0.5)对称。dveuUPu u 221323
11、.4.3 正态分布表的查法为了简化计算,随机变量( U)的值( u)落在区间( a,b)内的概率,根据标准正态累积分布函数,已经把不同 u 值的 (u)值列成表(附表 2) ,称为正态分布表。根据以下关系式可以扩展正态分布表的使用范围。例 1 查 u0.82 及 u1.15 时的 (u)值。解: (-0.82)0.20611 (1.15)0.87493例 2 随机变量 U 服从正态分布 N(0,1) ,问随机变量的值落在 0,1.21 间的概率是多少?落在1.96,1.96 间的概率是多少?解:1) P(0164 厘米的概率;3) X 在 156162 厘米间的概率。解:3.4.4 正态分布的
12、单侧临界值附表 3 给出了满足 P (U u ) = 时的 u 值。即曲线右侧尾区一定面积( )下,所对应的 u 值 u , u 称为 的上侧临界值。对于左侧尾区,满足 P (U u /2) = 时的 u /2称为 的双侧临界值。正态分布的单侧(上侧)和双侧临界值3.6 中心极限定理假设所研究的随机变量 X 可以被表示为许多相互独立的随机变量 Xi的和,如果 Xi的数量很大,而且每一个别的 Xi对于 X 所起的作用很小,则可以认为 X 服从或近似地服从正态分布。推理:若已知总体平均数为 ,标准差为 ,那么,不论该总体是否正态分布,对于从该总体所抽取的含量为 n 的样本,当 n 充分大,其平均数渐近服从正态分布 N(, 2/n)。