1、1,概率论与数理统计总复习,一、内容提要二、典型例题,2,随机试验,可能结果,基本事件Ai,不含任何,Ai任何组合,事件A,不可能,必然,完备事件组Ai,等概完备事件组,贝努利试验,独立试验 概型,只有两个可能结果,n次重复,古典概型,B由其中m个事件组成公式,(一)概念之间的关系,一、随机变量与概率,3,1、运算关系,包含: A 则 B,相等: A = B,和:至少有一个发 生 AUB,积:同时发生 AB,A、B不相容,A、B 对立 记为,差: AB,B =SA,(二)事件的关系,4,除与一般代数式运算相同的法则以外,注意,1)对偶律,2)其他,3)独立性,事件的独立性是由概率定义的;,n个
2、事件的独立性要求,个等式成立。,(三) 解题方法,1、一般概率,1) 利用两种概型,10 古典,20 n重贝努利概型,2) 利用事件间的运算,2、运算法则,5,化为事件的和,利用对立事件,A、B相互独立,分解到完备组中: 全概公式,利用随机变量及其分布计算。,一般情况,化为事件的积,一般情况,是完备组,,6,2) 用乘法公式,1) 在缩减完备组中计算,方法同 1。,3) 用贝叶斯公式,2、条件概率,7,一实数值X(i),(一)随机变量的定义,对于随机试验E的每一个可能结果i,的变量,,则称实数变量X(i)为一个随机变量,,简记为X。,注意:,1、X 是定义在随机试验结果的集合i 上,按试验的不
3、同结果而取不同的值.,取值是随机的.,2、在一定的试验下,,二、随机变量及其分布,都唯一地对应着,因此X的,可以依据我们所关心的结果的,数值特征选取 X 所代表的具体意义。,3、X 的引入使我们便于研究随机试验的全貌,,并使用分析的工具。,8,1、离散型随机变量,随机变量 X 的取值可以一一列举(有限或无限),定义,分布律(分布列) 表示法,称X 为离散型随机变量。,(二)随机变量的分布及性质,公式法,列表法,性质,9,定义,对于随机变量X,若存在非负函数,,使对任意实数,则称X为连续型随机变量,,的概率密度.,都有,其图形:,(2) 归一性,(1) 非负性,密度函数的性质,2、连续性随机变量
4、,10,3、分布函数,为X的分布函数. 记作,设 X是一个随机变量,称,定义,分布函数的性质,1、单调不减性:,3、右连续性:对任意实数 ,,2、归一 性:,若 x1x2, 则 F (x1) F (x2);,对任意实数x, 0 F(x) 1,且,11,1)分布函数,的值表示了X 落在,2)离散型: 若,分布函数的几点说明,是一个普通的函数,,内的概率。,由于,是X 取,的诸值,的概率之和,故又称,为累积概率函数.,图形特点:,是一条有跳跃的上升,阶梯形曲线。,12,3) X为连续性随机变量,在,13,3)把Y的分布用表(离散型)或Y的密度(连续性),1、问题:若,之间的事件等价关系。,关系和分
5、布函数关系。,是随机变量,,表述出来。,其中,已知X 的分布,求,的分布。,2、基本方法,4、随机变量函数的分布,是 x的函数。,研究,1)由,2)由,之间的事件的关系再求,之间的分布,3、具体讨论,14,则,当,若X的分布律,当,则,1) 离散型,推广得:,15,及有关函数表述出来。,求,其为等价的事件,将,用,利用,求出Y的密度函数。,2) 连续性,设 X是一个取值于区间,具有概率密度,的连续型随机变量,,16,性质:,(一)二维随机变量(X,Y) 的分布函数,定义,对于任意实数,二元函数,称为二维随机变量(X,Y)的分布函数,的联合分布函数。,或称为X和Y,三、二维随机变量及其分布,2.
6、,且,是变量,的不减函数。,17,(二)离散型,的所有可能取值为,设,则,和Y的联合分布列。,称为二维随机变量,的分布列,,或随机变量X,(非负性),(归一性),18,二维离散型随机变量的联合分布列,关于X的边缘分布,19,(X,Y )的边缘分布,设,的分布列为 :,分别记,20,(三)连续型,总有,的联合概率密度。,其具有以下性质:,定义 设二维随机变量,的分布函数为,,对任意实数,为,的概率密度,或称为随机变量,和,对于非负可积的函数,(非负性),(归一性),21,的关于X 和Y 的边缘概率密度。,定义 设,则,分别是,边缘概率密度,22,均有,(四)两个随机变量的独立性,若二维随机变量,
7、对任意的实数,成立,则称随机变量,与,是相互独立的。,若记,且,成立,,可见X,Y 相互独立的定义与两个事件相互,独立的定义是一致的。,判断X,Y 相互独立的办法:,23,其的概率密度为,的边缘概率密度分别为,24,四、随机变量的数字特征,(一)数学期望 E X,定义,X为离散型,X为连续型,若,X为离散型,X为连续型,X为离散型其分布列为,X为连续型其密度函数为,25,若 (X,Y ) 有联合密度,26,期望的性质,其中 C 为常数。,2. 对于任何常数,及 b.,3. 若,相互独立, 则,27,定义,计算公式,(二)方差,X为离散型其分布列为,X为连续型其密度函数为,X为离散型,X为连续型
8、,28,其中 k 为常数。,3. 对于任何常数,及 b.,相互独立, 则,方差的性质,29,均匀分布,泊松分布,二项分布,0-1分布,参数范围,方差,均值,概率分布,名称,(三)常用的六个分布,指数分布,30,标准正态分布,参数范围,方差,均值,概率分布,名称,(三)常用的六个分布,正态分布,任意,31,称为标准化的随机变量,有,2、正态分布随机变量函数的标准化.,表可查。,注意,32,COV ( X,Y )=E(XE X ) (YE Y ),若随机变量 X, Y 为离散型.,若随机变量 X, Y 为连续型.,协方差,相关系数,COV( X,Y )E( XY ) EXEY,一般计算公式,33,
9、COV( X,Y )E(XY) EXEY,可见,,存在的必要条件为,COV( X,Y ) 0 .,即,定义: 若,可见,若X与Y 独立,,称X与Y不相关。,D(X士Y) = D X + DY士2COV( X,Y ),D(X士Y) = D X + DY,即,34,1. COV( X,X ) E( X- EX )2 = DX ;,3. COV( aX, bY ) ab COV( X,Y ), a,b是常数;,4. COV( X1+X2 ,Y ) COV( X1,Y )+ COV( X2,Y ).,二、协方差与相关系数的性质,2. COV( X,Y ) COV( Y , X ) ;,COV ( X,
10、Y )=E(XE X ) (YE Y ),5.,35,2),3),4),1)相关系数,则称X与Y不相关;,四个等价命题:,36,或,(一) 切比雪夫不等式,五、大数定理与中心极限定理,设,对任意,不等式,成立,,则称此式为切比雪夫不等式,切比雪夫大数定律,独立同分布下的大数定律,贝努里大数定律,37,之和总可以近似服从正态分布.,(二)独立同分布下的中心极限定理,设X1,X2, Xn , 相互独立,,且服从同一分布,,具有相同的期望和方差,则,此定理表明,无论,原来服从什么,分布,,当n 充分大时,,即,38,(三)棣莫夫拉普拉斯中心极限定理,设随机变量,此定理的常用公式有:,39,数理统计,
11、一、 总体和样本,一个统计问题总有它明确的研究对象.,总体 ,个体总体中每个成员(元素)称为个体.,所抽取的部分个体称为样本.,组成样本的个体称为样品。,1、样本均值,设,是来自总体X的一个样本,,2、样本方差,40,二、极大似然估计法:,事件 发生的概率为,为 的函数,,形式已知,(如离散型) X的分布列为,的联合分布列为:,为样本的似然函数。,定义7.1,41,若总体X属连续型, 其概率密度,的形式已知,,为待估参数;,则,的联合密度:,一般,,关于可微,故可由下式求得:,因此,的极大似然估计也可从下式解得:,在同一点处取极值。,42,43,则,结论:设为来自总体 的一个样本,,任何总体的
12、样本矩都是统计量。,44,的证明都可以在教材上找到.,当总体为正态分布时,,教材上给出了几个重要的,抽样分布定理.,这里我们不加证明地叙述.,几个定理,定理 1 (样本均值的分布),设 X1,X2,Xn 是取自正态总体,则有,的样本,,n取不同值时样本均值 的分布,三、几个重要的抽样分布定理,45,对于给定的 算出1-,查标准正态分布表便可求得,46,设 X1, X2, , Xn 是取自正态总体,分别为样本均值和样本方差,则有,的样本,的分布,定理 2 (样本方差的分布),47,分布,分布是由正态分布派生出来的一种分布.,定义: 设随机变量,相互独立,都服从,标准正态分布N(0,1), 则称统
13、计量:,所服从的分布为自由度为 n1 的,分布.,分布的密度函数为,48,c2 分布的分位点,对于给定的正数,称满足条件,分位点.,分布的上,来定义.,通过积分,其中伽玛函数,的点,49,设 X1, X2 , Xn 是取自正态总体,的样本,分别为样本均值和样本方差, 则有,(与样本均值和样本方差有关 的一个分布),定理 3,定义: 设XN(0,1) , Y , 且X与Y相互独立,则称变量,所服从的分布为自由度为 n的 t 分布.,记为T .,50,t 分布的分位点,对于给定的正数,称满足条件,的点,为,分位点”。,分布的“上,51,四、正态总体均值和方差的区间估计,设,为总体,的样本,,分别是
14、样本均值和样本方差。,1、已知2时,的置信区间,设,2、未知2时,的置信区间,则的置信度为1的置信区间为,52,3、方差2的置信区间,这就是2的置信度为1的置信区间。,53,提出原假设和备择假设,第一步:,1、已知,第二步:,取统计量,在H0成立下求出它的分布,第三步:,查表确定临界值,使,对给定的显著性水平,均值假设检验过程分为五个步骤:,或,得H0否定域,一、单个正态总体均值的假设检验,设总体,其样本为,54,选择假设H1 表示U可能大于0,也可能小于0。,这称为双边假设检验。,由于取用的统计量服从 U分布,,第五步:判断,则否定H0,接受H1,则H0相容,接受H0,故称其为,U检验法。,
15、第四步:,将样本值 代入算出统计量,55,2、未知2,均值的假设检验,未知2,可用样本方差,代替2,检验步骤,提出原假设和备择假设,第一步:,第二步:,取一检验统计量,在H0成立下求出它的分布,第三步:,查表确定临界值,使,对给定的显著性水平,确定H0的否定域。,56,即“ ”是一个小概率事件 .,或,由于取用的统计量服从t分布,,第四步:,得H0否定域,将样本值 代入算出统计量,第五步:判断,则否定H0,接受H1,则H0相容,接受H0,故称其为t 检验法。,57,提出假设,取统计量,当H0成立有,或,是小概率事件。,在显著性水平条件下检验假设,则H0相容。,二、单个正态总体方差的假设检验,5
16、8,三、两个正态总体均值差的双侧假设检验,59,提出原假设和备择假设,第一步:,第二步:,取统计量,在H0成立下求出它的分布,第三步:,查表确定临界值,使,对给定的显著性水平,假设检验过程分为五个步骤:,其中,60,第四步:,将样本值 代入算出统计量,其中,61,第五步:判断,则否定H0,接受H1,则H0相容,接受H0,62,四、两个正态总体方差比的双侧假设检验,63,提出原假设和备择假设,第一步:,第二步:,取统计量,在H0成立下求出它的分布,第三步:,查表确定临界值,使,对给定的显著性水平,假设检验过程分为五个步骤:,及,64,第四步:,将样本值 代入算出统计量,第五步:判断,若,或,则否
17、定H0,接受H1,若,则H0相容,接受H0,65,例:某行业进行专业劳动技能考核,一个月安排一次,每人最多参加3次;某人第一次参加能通过的概率为60%;如果第一次未通过就去参加第二次,这时能通过的概率为80%;如果第二次再未通过,则去参加第三次,此时能通过的概率为90%。求这人能通过考核的概率。,65,解: 设 Ai= 这人第i次通过考核 ,i=1,2,3 A= 这人通过考核 ,,亦可:,典型例题,66,例:一单位有甲、乙两人,已知甲近期出差的概率为80%,若甲出差,则乙出差的概率为20%;若甲不出差,则乙出差的概率为90%。(1)求近期乙出差的概率;(2)若已知乙近期出差在外,求甲出差的概率
18、。,66,Bayes公式,全概率公式,解:设A=甲出差,B=乙出差,67,67,例3:设X的概率密度为 (1)求常数c的值; (2) 写出X的概率分布函数; (3) 要使 求k的值。 解:,68,68,例:,解:,例:,解:,69,例 设随机变量 的概率密度为,(1)确定常数 ;(2)求 ;(3)求 ;(4)求,70,解:(1)由 得,所以:,(2),71,(3),(4)在 的区域 : 上作直线 ,并记则,72,例 设二维随机变量(X ,Y )的密度函数为,试求随机变量 Z=X /Y 的密度函数.,73,74,例设 是相互独立的随机变量,证明,证:因 故,而 可能取的值为 且 相互独立,故,故:,75,解,例,76,77,78,79,80,81,例 设总体 的分布密度为,为总体 的样本,求参数 的矩估 计量.,解:由于 只含有一个未知参数 ,一般只需求出 便能得到 的矩估计量,但是,82,即 不含有 ,故不能由此得到 的矩估计量.为此, 求,故令,于是解得 的矩估计量为,83,惊人的预测,84,惊人的预测,85,惊人的预测,86,惊人的预测,87,谢谢,