1、2019/6/6,1,第二章 概率分布,2019/6/6,2,引 言,由于存在个体差异,即使从同一总体中抽取的两份样本之间也会有所不同,因此需要对总体特征做出描述。随机变量的分布常见的有三种类型:,正态分布(normal distribution)二项分布(binominal distribution)Poisson 分布( Poisson distribution),离散型变量,连续型变量,2019/6/6,3,了解正态分布的密度函数二项分布的应用 Poisson分布的应用,掌握正态分布曲线的特征及应用二项分布的概念与特征Poisson分布的概念与特征,【教学目的】,2019/6/6,4,概
2、念频率密度图的绘制例:随机调查某医院1402例待分娩孕妇,测得她们的体重。体重在各组段的频数分布见表1第2列,并求得体重落在各组段的频率(表1的第3列)。现以体重测量值为横轴,以频率与组距的比值为纵轴作出直方图。由于该直方图的纵轴表示在每个组段内单位长所占有的频率,相当于频率密度,因此我们将此图称为频率密度图(见图1)。,一、正态分布,2019/6/6,5,表1 某医院1402例分娩孕妇体重频数分布,图1 体重频率密度图,2019/6/6,7,若将各直条顶端的中点顺次连接起来,得到一条折线。当样本量n越来越大时,组段越分越细,此时直方渐进直条,这条折线就越来越接近于一条光滑的曲线(见图1、2)
3、,我们把这条呈中间高,两边低,左右基本对称的“钟型”曲线称为正态分布曲线,近似于数学上的正态分布(高斯分布; Gauss)。,2019/6/6,8,图1 体重频率密度图,图2 概率密度曲线示意图,2019/6/6,9,正态分布的密度函数,式中,m为总体均数,s为总体标准差,p为圆周率,e为自然对数的底,仅x为变量。 当x确定后, f(x)为X相应的纵坐标高度,则X服从参数为和2的正态分布(normal distribution),记作XN( m, s2)。,2019/6/6,10,一般地,若连续型随机变量,设其概率密度函数为 ,则X取值落在区间 内的累积概率为概率密度曲线下位于 的图形面积,等
4、于其概率密度函数 在 到x上的积分,记作 。,称 为正态分布 的概率密度函数。其值表示变量落在区间 的概率,对应于从-到x概率密度曲线下的阴影的面积(常称为左侧尾部面积),见图3。,2019/6/6,12,图3 正态分布的概率密度函数,2019/6/6,13,于是,利用概率密度函数 可以计算正态分布变量取值在任意区间(a,b)的概率为,P(aX5,且n(1-)5时,二项分布趋于正态分布。,图7 二项分布的概率分布示意图,2019/6/6,53,4. 二项分布的应用,4.1 应用条件各观察单位只具有相互对立的两种结果;已知发生某一结果的概率为p,其对立结果的概率则为1-p; n个观察单位的观察结
5、果相互独立。4.2 应用概率计算;,2019/6/6,54,例:据报道,有10%的人对某药有肠道反应。为考察此药的质量,现随机选5人服用此药,试求: (1)其中k个人(k=0,1,2,3,4,5)有反应的概率;(2)不多于2人有反应的概率;(3)有人有反应的概率。,例:设在人群中感染某种疾病的概率为20%,现有两种疫苗,用疫苗A注射了15人后无一感染,用疫苗B注射15人后有1人感染,设人群没有相互传染疾病的可能,问:应该如何评价这两种疫苗?解:假设疫苗A、B完全无效,那么注射后感染的概率仍为20%,则15人中染病人数XB(15,0.20)。X=0的概率为,X1的概率为,2019/6/6,56,
6、Poisson分布是一个重要的离散型概率分布。一般地,Poisson分布应用于观察例数n很大、而p发生的概率很小的情况。如,交通事故发生数,某些罕见疾病发生数,单位容积中的细菌计数、细胞计数,放射性物质在单位时间内放射的粒子数,单位空间的粉尘个数等等。此时,随机变量X(发生数等)所有可能的取值以及相应的概率分布即为Poisson分布。,三、Poisson分布,历史上, Poisson分布是作为二项分布的近似,于1837年由法国数学家Poisson引入 。,近年来, Poisson分布日益显示其重要性,成为概率论中最重要的几个分布之一。,在实际生活中,许多随机现象服从或近似服从泊松分布。,在生物
7、学、医学、工业统计、保险科学等问题中 , 泊松分布是常见的。如地震、火山爆发、特大洪水、交通事故次数等, 都服从泊松分布。,泊松分布的图形,图8 Poisson分布的示意图,2019/6/6,60,1. Poisson分布的概率函数:,此处m0,是某一常数,e是自然对数的底数,称X服从参数为m的Poisson分布,记为XP(m),可见,Poisson分布可作为二项分布的极限而得到。换言之,如果XB(n,p),当p很小,而n很大时,可以认为X近似服从m=np的Poisson分布P(m)。,2019/6/6,61,Poisson分布属于离散型分布,是Poisson分布的总体参数,也是唯一的参数。方
8、差s2与均数相等,即m=s2。这是Poisson分布的一个非常重要而且非常独特的性质,经常用于判断某随机事件是否服从Poisson分布。设 且 ,并且X1与X2相互独立,则 服从总体均数为 的Poisson分布。当20时,poisson分布近似正态分布,2. Poisson分布的特性,2019/6/6,62,3. 应用,应用条件:由于Poisson分布可以看作二项分布的极限分布,二项分布的应用条件也是Poisson分布的应用条件。此外,Poisson分布还要求试验次数n很大,而所关心的事件发生的概率p很小。,2019/6/6,63,概率计算,例: 为监测饮用水的污染情况,现检验某社区每毫升饮用
9、水中细菌数,共得400个,记录如下表:,表5 某社区每毫升饮用水中细菌数,试分析饮用水中细菌数的分布是否服从Poisson分布。若服从,计算每毫升水中细菌数的概率及理论次数,并将次数分布与Poisson分布做直观比较,2019/6/6,64,得:经计算得每毫升水中平均细菌数 =0.5,方差S2=0.496。两者接近,近似服从Poisson分布。,2019/6/6,65,例如某均匀的溶液中,每ml含有3个细菌,即XP(3)。现考虑5ml溶液中的细菌的分布情况。由于X iP(3) i=1,2,3,4,5。据Poisson分布的可加性可得: X1 X2 X3 X4 X5 P(15) 即5ml溶液中的
10、细菌数仍然服从Poisson分布,均数为15。,2019/6/6,66,选择题,1. 理论上,二项分布是一种A 连续性分布 B 离散分布 C 均匀分布 D 标准正态分布 2. 在样本例数不变的情况下,下列何种情况时,二项分布越接近对称分布。A 总体比例越大 B 样本比例P越大 C 总体比例越接近0.5 D 总体比例越小,2019/6/6,67,3.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般 A.该指标在所有人中的波动范围 B.该指标在所有正常人中的波动范围 C.该指标在绝大部分正常人中的波动范围 D.该指标在少部分正常人中的波动范围 E.该指标在一
11、个人不同时间的波动范围,2019/6/6,68,4. 正态分布的特点有A.算术均数=几何均数 B.算术均数=中位数C.几何均数=中位数 D.算术均数=几何均数=中位数E.以上都没有,2019/6/6,69,5. 正态分布曲线下右侧5对应的分位点为A.+1.96 B.-1.96C.+2.58 D.+1.64E.-2.58,2019/6/6,70,计算题 某地1998年抽样调查了100名18岁男大学生身高,其均数=172.70cm,标准差=4.01 cm。 (1)估计该地18岁男大学生身高在168 cm以下者占该地18岁男大学生总数的百分数; (2)估计该地18岁男大学生身高在177 cm以下者占该地18岁男大学生总数的百分数。,2019/6/6,71,THANK YOU!,