1、概率与统计,开课系:非数学专业教师: 叶梅燕e-mail: yemeiyan ,教材:概率论与数理统计王松桂 等编科学出版社2002,参考书:1.概率论与数理统计浙江大学 盛骤等 编高等教育出版社2. 概率论与数理统计魏振军 编中国统计出版社,序 言,?,概率论是研究什么的?,随机现象:不确定性与统计规律性,概率论研究和揭示随机现象的统计规律性的科学,目 录,第一章 随机事件及其概率第二章 随机变量第三章 随机变量的数字特征第四章 样本及抽样分布第五章 参数估计第六章 假设检验,第一章 随机事件及其概率,随机事件及其运算概率的定义及其运算条件概率事件的独立性,1.1随机事件及其概率一、随机试验
2、(简称“试验”),随机试验的特点(p1)1.可在相同条件下重复进行; 2.一次试验之前无法确定具体是哪种结果出现,但能确定所有的可能结果。 随机试验常用E表示,E1: 抛一枚硬币,分别用“H” 和“T” 表示出正面和反面;E2: 将一枚硬币连抛三次,考虑正反面出现的情况;E3:某城市某年某月内发生交通事故的次数;E4:掷一颗骰子,可能出现的点数;E5: 记录某网站一分钟内受到的点击次数;E6:在一批灯泡中任取一只,测其寿命;E7:任选一人,记录他的身高和体重 。,随机实验的例子,随机事件,二、样本空间(p2),1、样本空间:试验的所有可能结果所组成的集合称为样本空间,记为 =e; 2、样本点:
3、 试验的单个结果或样本空间的单元素称为样本点,记为e. 3.由样本点组成的单点集称为基本事件,也记为e.,幻灯片 6,随机事件,1.定义 样本空间的任意一个子集称为随机事件, 简称“事件”.记作A、B、C等 任何事件均可表示为样本空间的某个子集.称事件A发生当且仅当试验的结果是子集A中的元素。 2.两个特殊事件: 必然事件S 、不可能事件.(p3) 例如 对于试验E2 ,以下A 、 B、C即为三个随机事件: A“至少出一个正面” HHH, HHT, HTH, THH,HTT,THT,TTH; B = “两次出现同一面”=HHH,TTTC=“恰好出现一次正面”=HTT,THT,TTH再如,试验E
4、6中D“灯泡寿命超过1000小时”x:1000xm),要求第 i 组恰有ni个球(i=1,m),共有分法:,4 随机取数问题,例4 从1到200这200个自然数中任取一个,(1)求取到的数能被6整除的概率(2)求取到的数能被8整除的概率(3)求取到的数既能被6整除也能被8整除的概率,解:N(S)=200,N(3)=200/24=8,N(1)=200/6=33,N(2)=200/8=25,(1),(2),(3)的概率分别为:33/200,1/8,1/25,某人向目标射击,以A表示事件“命中目标”,P(A)=?,?,定义:(p8) 事件A在n次重复试验中出现nA次,则比值nA/n称为事件A在n次重
5、复试验中出现的频率,记为fn(A). 即 fn(A) nA/n.,1.3 频率与概率,历史上曾有人做过试验,试图证明抛掷匀质硬币时,出现正反面的机会均等。 实验者 n nH fn(H)De Morgan 2048 1061 0.5181 Buffon 4040 2048 0.5069K. Pearson 12000 6019 0.5016K. Pearson 24000 12012 0.5005,频率的性质(1) 0 fn(A) 1;(2) fn(S)1; fn( )=0(3) 可加性:若AB ,则 fn(AB) fn(A) fn(B).,实践证明:当试验次数n增大时, fn(A) 逐渐 趋向
6、一个稳定值。可将此稳定值记作P(A),作为事件A的概率,1.3.2. 概率的公理化定义,注意到不论是对概率的直观理解,还是频率定义方式,作为事件的概率,都应具有前述三条基本性质,在数学上,我们就可以从这些性质出发,给出概率的公理化定义,1.定义(p8) 若对随机试验E所对应的样本空间中的每一事件A,均赋予一实数P(A),集合函数P(A)满足条件:(1) P(A) 0;(2) P()1; (3) 可列可加性:设A1,A2,, 是一列两两互不相容的事件,即AiAj,(ij), i , j1, 2, , 有 P( A1 A2 ) P(A1) P(A2)+. (1.1)则称P(A)为事件A的概率。,2
7、.概率的性质 P(10-13) (1) 有限可加性:设A1,A2,An , 是n个两两互不相容的事件,即AiAj ,(ij), i , j1, 2, , n ,则有 P( A1 A2 An) P(A1) P(A2)+ P(An);,(3)事件差 A、B是两个事件,则P(A-B)=P(A)-P(AB),(2) 单调不减性:若事件AB,则P(A)P(B),(4) 加法公式:对任意两事件A、B,有 P(AB)P(A)P(B)P(AB) 该公式可推广到任意n个事件A1,A2,An的情形;(3) 互补性:P(A)1 P(A);(5) 可分性:对任意两事件A、B,有 P(A)P(AB)P(AB ) .,某
8、市有甲,乙,丙三种报纸,订每种报纸的人数分别占全体市民人数的30%,其中有10%的人同时定甲,乙两种报纸.没有人同时订甲乙或乙丙报纸.求从该市任选一人,他至少订有一种报纸的概率.,EX,解:设A,B,C分别表示选到的人订了甲,乙,丙报,例1.3.2.在110这10个自然数中任取一数,求(1)取到的数能被2或3整除的概率,(2)取到的数即不能被2也不能被3整除的概率,(3)取到的数能被2整除而不能被3整除的概率。,解:设A取到的数能被2整除;B-取到的数能被3整除,故,袋中有十只球,其中九只白球,一只红球,十人依次从袋中各取一球(不放回),问第一个人取得红球的概率是多少?第二 个人取得红球的概率
9、是多少?,?,1.4 条件概率,若已知第一个人取到的是白球,则第二个人取到红球的概率是多少?,已知事件A发生的条件下,事件B发生的概率称为A条件下B的条件概率,记作P(B|A),若已知第一个人取到的是红球,则第二个人取到红球的概率又是多少?,一、条件概率例1 设袋中有3个白球,2个红球,现从袋中任意抽取两次,每次取一个,取后不放回,(1)已知第一次取到红球,求第二次也取到红球的概率; (2)求第二次取到红球的概率(3)求两次均取到红球的概率,设A第一次取到红球,B第二次取到红球,S=,A,B,A第一次取到红球,B第二次取到红球,显然,若事件A、B是古典概型的样本空间S中的两个事件,其中A含有n
10、A个样本点,AB含有nAB个样本点,则,称为事件A发生的条件下事件B发生的条件概率(p14),一般地,设A、B是S中的两个事件,则,?,“条件概率”是“概率”吗?,概率定义 若对随机试验E所对应的样本空间S中的每一事件A,均赋予一实数P(A),集合函数P(A)满足条件:P(A) 0; (2) P(S)1;(3) 可列可加性:设A1,A2,, 是一列两两互不相容的事件,即AiAj,(ij), i , j1, 2, , 有 P( A1 A2 ) P(A1) P(A2)+. 则称P(A)为事件A的概率。,例2.(p14)一盒中混有100只新 ,旧乒乓球,各有红、白两色,分 类如下表。从盒中随机取出一
11、球,若取得的是一只红球,试求该红球是新球的概率。,设A-从盒中随机取到一只红球. B-从盒中随机取到一只新球.,A,B,二、乘法公式(p15),设A、B ,P(A)0,则 P(AB)P(A)P(B|A). (1.4.2)式(1.4.2)就称为事件A、B的概率乘法公式。,式(1.4.2)还可推广到三个事件的情形: P(ABC)P(A)P(B|A)P(C|AB). (1.4.3) 一般地,有下列公式: P(A1A2An)P(A1)P(A2|A1).P(An|A1An1). (1.4.4),例3 合中有3个红球,2个白球,每次从袋中任取一只,观察其颜色后放回,并再放入一只与所取之球颜色相同的球,若从
12、合中连续取球4次,试求第1、2次取得白球、第3、4次取得红球的概率。,解:设Ai为第i次取球时取到白球,则,三、全概率公式与贝叶斯公式,例4.(p16)市场上有甲、乙、丙三家工厂生产的同一品牌产品,已知三家工厂的市场占有率分别为1/4、1/4、1/2,且三家工厂的次品率分别为 2、1、3,试求市场上该品牌产品的次品率。,B,定义 (p17)事件组A1,A2,An (n可为),称为样本空间的一个划分,若满足:,A1,A2,An,B,定理1、(p17) 设A1,, An是的一个划分,且P(Ai)0,(i1,n),则对任何事件B 有,式(1.4.5)就称为全概率公式。,例5 (P17)有甲乙两个袋子
13、,甲袋中有两个白球,1个红球,乙袋中有两个红球,一个白球这六个球手感上不可区别今从甲袋中任取一球放入乙袋,搅匀后再从乙袋中任取一球,问此球是红球的概率?,解:设A1从甲袋放入乙袋的是白球;A2从甲袋放入乙袋的是红球;B从乙袋中任取一球是红球;,甲,乙,定理2 (p18) 设A1,, An是S的一个划分,且P(Ai) 0,(i1,n),则对任何事件BS,有,式(1.4.6)就称为贝叶斯公式。,思考:上例中,若已知取到一个红球,则从甲袋放入乙袋的是白球的概率是多少?,答:,(P22,22.) 商店论箱出售玻璃杯,每箱20只,其中每箱含0,1,2只次品的概率分别为0.8, 0.1, 0.1,某顾客选
14、中一箱,从中任选4只检查,结果都是好的,便买下了这一箱.问这一箱含有一个次品的概率是多少?,解:设A:从一箱中任取4只检查,结果都是好的. B0, B1, B2分别表示事件每箱含0,1,2只次品,已知:P(B0)=0.8, P(B1)=0.1, P(B2)=0.1,由Bayes公式:,例6(p18)数字通讯过程中,信源发射0、1两种状态信号,其中发0的概率为0.55,发1的概率为0.45。由于信道中存在干扰,在发0的时候,接收端分别以概率0.9、0.05和0.05接收为0、1和“不清”。在发1的时候,接收端分别以概率0.85、0.05和0.1接收为1、0和“不清”。现接收端接收到一个“1”的信
15、号。问发端发的是0的概率是多少?,0.067,解:设A-发射端发射0, B- 接收端接收到一个“1”的信号,0 (0.55),0 1 不清,(0.9)(0.05)(0.05),1 (0.45),1 0 不清,(0.85)(0.05)(0.1),条件概率,条件概率 小 结,缩减样本空间,定义式,乘法公式,全概率公式,贝叶斯公式,1.5 事件的独立性一、两事件独立,(P19) 定义1 设A、B是两事件,P(A) 0,若 P(B)P(B|A) (1.5.1)则称事件A与B相互独立。式(1.5.1)等价于: P(AB)P(A)P(B) (1.5.2),从一付52张的扑克牌中任意抽取一张,以A表示抽出一
16、张A,以B表示抽出一张黑桃,问A与B是否独立?,定理、以下四件事等价:(1)事件A、B相互独立;(2)事件A、B相互独立;(3)事件A、B相互独立;(4)事件A、B相互独立。,二、多个事件的独立,定义2、(p20) 若三个事件A、B、C满足:(1) P(AB)=P(A)P(B), P(AC)=P(A)P(C), P(BC)=P(B)P(C),则称事件A、B、C两两相互独立;,若在此基础上还满足:(2) P(ABC)P(A)P(B)P(C), (1.5.3)则称事件A、B、C相互独立。,一般地,设A1,A2,An是n个事件,如果对任意k (1kn), 任意的1i1i2 ik n,具有等式 P(A
17、 i1 A i2 A ik)P(A i1)P(A i2)P(A ik) (1.5.4)则称n个事件A1,A2,An相互独立。,思考:1.设事件A、B、C、D相互独立,则,2.一颗骰子掷4次至少得一个六点与两颗骰子掷24次至少得一个双六,这两件事,哪一个有更多的机会遇到?,答:0.518, 0.496,三、事件独立性的应用,1、加法公式的简化:若事件A1,A2,An相互独立, 则 (1.5.5),2、在可靠性理论上的应用P23, 24如图,1、2、3、4、5表示继电器触点,假设每个触点闭合的概率为p,且各继电器接点闭合与否相互独立,求L至R是通路的概率。,设A-L至R为通路,Ai-第i个继电器通
18、,i=1,2,5,由全概率公式,EX1:一个学生欲到三家图书馆借一本参考书每家图书馆购进这种书的概率是1/2,购进这种书的图书馆中该书被借完了的概率也是1/2各家图书馆是否购进该书相互独立问该学生能够借到书的概率是多少?,第一章 小结本章由六个概念(随机试验、事件、概率、条件概率、独立性),四个公式(加法公式、乘法公式、全概率公式、贝叶斯公式)和一个概型(古典概型)组成,第二章随机变量,离散型随机变量随机变量的分布函数连续型随机变量 一维随机变量函数的分布二维随机变量的联合分布多维随机变量的边缘分布与独立性条件分布多维随机变量函数的分布,关于随机变量(及向量)的研究,是概率论的中心内容这是因为
19、,对于一个随机试验,我们所关心的往往是与所研究的特定问题有关的某个或某些量,而这些量就是随机变量也可以说:随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点,一如数学分析中的常量与变量的区分那样变量概念是高等数学有别于初等数学的基础概念同样,概率论能从计算一些孤立事件的概念发展为一个更高的理论体系,其基础概念是随机变量,2.1随机变量的概念,(p24)定义. 设S=e是试验的样本空间,如果量X是定义在S上的一个单值实值函数即对于每一个eS,有一实数X=X(e)与之对应,则称X为随机变量。随机变量常用X、Y、Z 或 、等表示。,随机变量的特点:,1 X的全部可能取值是互斥且完备的
20、,2 X的部分可能取值描述随机事件,?,请举几个实际中随机变量的例子,EX引入适当的随机变量描述下列事件:将3个球随机地放入三个格子中,事件A=有1个空格,B=有2个空格,C=全有球。进行5次试验,事件D=试验成功一次,F=试验至少成功一次,G=至多成功3次,随机变量的分类:随机变量,2.2离散型随机变量,(P25)定义 若随机变量X取值x1, x2, , xn, 且取这些值的概率依次为p1, p2, , pn, , 则称X为离散型随机变量,而称PX=xk=pk, (k=1, 2, ) 为X的分布律或概率分布。可表为 X PX=xk=pk, (k=1, 2, ),或,Xx1 x2xKPkp1p
21、2pk,(1) pk 0, k1, 2, ;(2),例1 设袋中有5只球,其中有2只白3只黑。现从中任取3只球(不放回),求抽得的白球数X为k的概率。解 k可取值0,1,2,2. 分布律的性质,例2.某射手对目标独立射击5次,每次命中目标的概率为p,以X表示命中目标的次数,求X的分布律。,解:设Ai第i次射击时命中目标,i=1,2,3,4,5则A1,A2,A5,相互独立且P(Ai)=p,i=1,2,5. SX=0,1,2,3,4,5,(1-p)5,几个常用的离散型分布(一)贝努里(Bernoulli)概型与二项分布,1. (0-1)分布(p26) 若以X表示进行一次试验事件A发生的次数,则称X
22、服从(01)分布(两点分布) XPXkpk(1p)1k, (0p1时,X的全部取值为:m,m+1,m+2,PX=m+1=P第m+1次试验时成功并且 在前m次试验中成功了m-1次,想一想:离散型随机变量的统计特征可以用分布律描述,非离散型的该如何描述?如:熊猫彩电的寿命X是一个随机变量,对消费者来说,你是否在意X5年还是X5年零1分钟,2.3 随机变量的分布函数一、分布函数的概念.,定义(P29) 设X是随机变量,对任意实数x,事件Xx的概率PXx称为随机变量X的分布函数。记为F(x),即 F(x)P Xx. 易知,对任意实数a, b (ab), P aXbPXbPXa F(b)F(a).,二、
23、分布函数的性质(P29),1、单调不减性:若x1x2, 则F(x1)F(x2); 2、归一 性:对任意实数x,0F(x)1,且,3、右连续性:对任意实数x,,反之,具有上述三个性质的实函数,必是某个随机变量的分布函数。故该三个性质是分布函数的充分必要性质。,一般地,对离散型随机变量 XPX= xkpk, k1, 2, 其分布函数为,例1 设随机变量X具分布律如右表,解,试求出X的分布函数。,例2 向0,1区间随机抛一质点,以X表示质点坐标.假定质点落在0,1区间内任一子区间内的概率与区间长成正比,求X的分布函数解: F(x)=PXx,当x1时,F(x)=1,当0x1时,特别,F(1)=P0x1
24、=k=1,用分布函数描述随机变量不如分布律直观,对非离散型随机变量,是否有更直观的描述方法?,?,a,b,2.4 连续型随机变量一、概率密度,1. 定义(p33) 对于随机变量X,若存在非负函数f(x),(-x+),使对任意实数x,都有,则称X为连续型随机变量, f(x)为X的概率密度函数,简称概率密度或密度函数. 常记为X f(x) , (-x+),密度函数的几何意义为,2. 密度函数的性质 (p34) (1) 非负性 f(x)0,(-x); (2)归一性,性质(1)、(2)是密度函数的充要性质;,EX,设随机变量X的概率密度为,求常数a.,答:,(3) 若x是f(x)的连续点,则,EX,设
25、随机变量X的分布函数为求f(x),(4) 对任意实数b,若X f(x),(-x),则PX=b0。于是,P(35) 例2.3.2.已知随机变量X的概率密度为1)求X的分布函数F(x), 2)求PX(0.5,1.5),二、几个常用的连续型分布,1. 均匀分布(p36) 若Xf(x),则称X在(a, b)内服从均匀分布。记作 XU(a, b),对任意实数c, d (acd0的指数分布。其分布函数为,例 .电子元件的寿命X(年)服从参数为3的指数分布(1)求该电子元件寿命超过2年的概率。(2)已知该电子元件已使用了1.5年,求它还能使用两年的概率为多少?,解,例.某公路桥每天第一辆汽车过桥时刻为T,设
26、0,t时段内过桥的汽车数Xt服从参数为t的泊松分布,求T的概率密度。,解,当t 0时,,当t 0时,,=1- 在t时刻之前无汽车过桥,于是,正态分布是实践中应用最为广泛,在理论上 研究最多的分布之一,故它在概率统计中占有特 别重要的地位。,3. 正态分布,A,B,A,B间真实距离为,测量值为X。X的概率密度应该是什么形态?,其中 为实数, 0 ,则称X服从参数为 ,2的正态分布,记为N(, 2),可表为XN(, 2).,若随机变量,(1) 单峰对称 密度曲线关于直线x=对称;(p38)f()maxf(x) .,正态分布有两个特性:,(2) 的大小直接影响概率的分布越大,曲线越平坦,越小,曲线越
27、陡峻,。正态分布也称为高斯(Gauss)分布,4.标准正态分布(p38) 参数0,21的正态分布称为标准正态分布,记作XN(0, 1)。,分布函数表示为,其密度函数表示为,一般的概率统计教科书均附有标准正态分布表供读者查阅(x)的值。(P226附表1)如,若ZN(0,1),(0.5)=0.6915,P1.32Z2.43=(2.43)-(1.32)=0.9925-0.9066,注:(1) (x)1 (x); (2) 若XN(, 2),则,正态分布表,EX,设随机变量XN(-1,22),P-2.45X2.45=?,P(39)例2.3.5.设 XN(,2),求P-3X3的值. 如在质量控制中,常用标
28、准指标值3作两条线,当生产过程的指标观察值落在两线之外时发出警报.表明生产出现异常.,正态分布表,(p67)14 一种电子元件的使用寿命(小时)服从正态分布(100,152),某仪器上装有3个这种元件,三个元件损坏与否是相互独立的.求:使用的最初90小时内无一元件损坏的概率.,解:设Y为使用的最初90小时内损坏的元件数,故,则YB(3,p),其中,正态分布表,一、离散型随机变量函数的分布律,2.5 一维随机变量函数的分布,(p55) 设X一个随机变量,分布律为 XPXxkpk, k1, 2, 若yg(x)是一元单值实函数,则Yg(X)也是一个随机变量。求Y的分布律.,例:已知,X,Pk,-1
29、0 1,求:Y=X2的分布律,Y,Pk,1 0,或 Yg(X)PYg(xk)pk , k1, 2, (其中g(xk)有相同的,其对应概率合并。),一般地,X,Pk,Y=g(X),二、连续型随机变量函数的密度函数,1、一般方法(p56) 若Xf(x), - x +, Y=g(X)为随机变量X 的函数,则可先求Y的分布函数 FY (y) PYyP g(X) y,然后再求Y的密度函数,此法也叫“ 分布函数法”,例1.设XU(-1,1),求Y=X2的分布函数与概率密度。,当y0时,当0y1时,当y1时,例2.设X的概率密度为fX(x),y=g(x)关于x处处可导且是x的严格单减函数,求Y=g(X)的概
30、率密度。解:Y的分布函数为,FY(y)=PYy=Pg(X)y=PXg-1(y)=1-FX(g-1(y),Y的概率密度为 fY(y)=F(g-1(y)=fX(g-1(y) g-1(y),2、公式法:一般地 若XfX(x), y=g(x)是单调可导函数,则,注:1 只有当g(x)是x的单调可导函数时,才可用以上公式推求Y的密度函数。2 注意定义域的选择,其中h(y)为yg(x)的反函数.,例3.已知XN(,2),求,解:,的概率密度,关于x严单,反函数为,故,例4 设XU(0,1),求Y=ax+b的概率密度.(a0),解: Y=ax+b关于x严单,反函数为,故,而,故,小结.,习题课,一、填空:1
31、.设随机变量X服从参数为(2,p)的二项分布,随机变量Y服从参数(3,p)的二项分布,若 , 则PY1=,2.设随机变量X服从(0,2)上的均匀分布,则随机变量Y=X2在(0,4)内的密度函数为fY(y)=,3.设随机变量XN(2,2),且P(2X4)=0.3,则P(X0)=,二.从某大学到火车站途中有6个交通岗,假设在各个交通岗是否遇到红灯相互独立,并且遇到红灯的概率都是1/3.以Y表示汽车在第一次停止之前所通过的交通岗数,求Y的分布律.(假定汽车只在遇到红灯或到达火车站时停止),三、某射手对靶射击,单发命中概率都为0.6,现他扔一个均匀的骰子,扔出几点就对靶独立射击几发,求他恰好命中两发的概率。,四.已知随机变量X的概率密度为,求:Y=1-X2的概率密度,2.6 二维随机变量的联合分布一、 多维随机变量,1.定义(p41)将n个随机变量X1,X2,.,Xn构成一个n维向量 (X1,X2,.,Xn)称为n维随机变量。,一维随机变量XR1上的随机点坐标二维随机变量(X,Y)R2上的随机点坐标n维随机变量(X1,X2,Xn)Rn上的随机点坐标多维随机变量的研究方法也与一维类似,用分布函数、概率密度、或分布律来描述其统计规律,