1、概率论部分,主讲:吕 靖,概率(或然率或几率) 随机事件出现,的可能性的量度 其起源与博弈问题有关.,16世纪意大利学者开始研究掷骰子等赌博,中的一些问题;17世纪中叶,法国数学家B. 帕,斯卡、荷兰数学家C. 惠更斯 基于排列组合的方,法,研究了较复杂 的赌博问题, 解决了“ 合理,分配赌注问题” ( 即得分问题 ).,概率论是一门研究客观世界随机现象数量,规律的 数学分支学科.,发展则在17世纪微积分学说建立以后.,基人是瑞士数学家J.伯努利;而概率论的飞速,数理统计学是一门研究怎样去有效地收集、,整理和分析带有随机性的数据,以对所考察的,问题作出推断或预测,直至为采取一定的决策,和行动提
2、供依据和建议的 数学分支学科.,论;使 概率论 成为 数学的一个分支的真正奠,对客观世界中随机现象的分析产生了概率,统计方法的数学理论要用到很多近代数学,知识,如函数论、拓扑学、矩阵代数、组合数,学等等,但关系最密切的是概率论,故可以这,样说:概率论是数理统计学的基础,数理统计,学是概率论的一种应用. 但是它们是两个并列,的数学分支学科,并无从属关系.,1 随机事件及其运算2 事件的概率及其运算,第一章 随机事件与概率,退 出,目 录,前一页,后一页,确定性现象:结果确定不确定性现象:结果不确定,确定,不确定,不确定,自然界与社会生活中的两类现象,例: 向上抛出的物体会掉落到地上,明天天气状况
3、,买了彩票会中奖,一次抛掷硬币实验(出现正面朝上),多次抛掷硬币实验(出现正面朝上的次数),不确定,近半数,这种在个别实验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,称为随机现象。,概率论与数理统计是研究和揭示随机现象规律性的一门数学学科。,一 随 机 事 件(一)随机试验(二)样本空间(三)随机事件二 事件间的关系与运算(一)事件间的关系(二)随机事件的运算,1 随 机 事 件 及 其 运 算,第一章 随机事件与概率,退 出,目 录,前一页,后一页,一、随机事件,E1:抛一枚硬币,观察正面H(Heads)、反面T (Tails)出现的情况。,E3:记录某城市120急
4、救电话台一昼夜接到的呼叫次数;,E2:抛一颗骰子,观察出现的点数。,E4:观察某一电子元件的寿命。,E5:观察某地区一昼夜的最低温度和最高温度。,E6: 将一枚硬币连抛三次,考虑正反面出现的情况;,E7: 将一枚硬币连抛三次,考虑正面出现的次数;,(一)随机试验,思考以下案例:,这些事件具有以下共同点:1、可以在相同条件下重复;2、每次试验的结果可能不止一个,并且能事先明确试验的所有可能结果;3、进行一次试验之前不能确定哪一个结果会出现。称具备上面三个特点的试验为随机试验。,定义 将随机试验 E 的所有可能结果组成的集合 称为 E 的样本空间, 记为 。样本空间的 元素,即 E 的每个结果,称
5、为样本点。,要求:会写出随机试验的 样本空间。,退 出,前一页,后一页,目 录,(二)样本空间,一、随机事件,E1:抛一枚硬币,观察正面H(Heads)、反面T (Tails)出现的情况。,E3:记录某城市120急救电话台一昼夜接到的呼叫次数。,E2:抛一颗骰子,观察出现的点数。,E4:观察某一电子元件的寿命。,E5:观察某地区一昼夜的最低温度和最高温度。,E6: 将一枚硬币连抛三次,考虑正反面出现的情况;,E7: 将一枚硬币连抛三次,考虑正面出现的次数;,S1 : H , T ,S2 : 1, 2, 3, 4, 5, 6 ,S3 : 0,1,2,3,S5 : ( x , y ) | T 0
6、x y T1 ,S6 : HHH, HHT, HTH, THH,HTT,THT,TTH, TTT ,S7 : 0, 1, 2, 3 ,一、随机事件,S4 : t | t 0 ,随机事件 : 称试验 E 的样本空间的子集为 E 的 随机事件,记作 A, B, C 等等;基本事件 : 由一个样本点组成的单点集;必然事件 : 样本空间 S 本身;不可能事件 : 空集。,我们称一个随机事件发生当且仅当它所包含的一个样本点在试验中出现。,退 出,前一页,后一页,目 录,(三)随机事件,一、随机事件,例如:S2 中,事件 A=2,4,6 表示 “出现偶数点”;,事件 B=1,2,3,4 表示 “出现的点数
7、不超过4”.,退 出,前一页,后一页,目 录,一、随机事件,1) 包含关系,二 、 事件间的关系与运算,如果A发生必导致B发生,则,2)相等关系,退 出,前一页,后一页,目 录,(一)事件间的关系,3) 和(并)事件,事件 发生当且仅当 A, B 至少发生一个 .,二、事件间的关系,退 出,前一页,后一页,目 录,4) 积(交)事件,事件 发生当且仅当 A , B 同时发生.,退 出,前一页,后一页,目 录,二、事件间的关系,考察下列事件间的包含关系:,退 出,前一页,后一页,目 录,二、事件间的关系,5) 差事件,发生当且仅当 A 发生 B 不发生.,退 出,前一页,后一页,目 录,二、事件
8、间的关系,6) 互不相容(互斥),7) 对立事件 (逆事件),请注意互不相容与对立事件的区别!,退 出,前一页,后一页,目 录,二、事件间的关系,例如,在S4 中,事件 A=t|t1000,表示 “产品是次品”,事件 B=t|t 1000,表示 “产品是合格品”,事件 C=t|t1500,表示“产品是一级品”,则,表示 “产品是合格品但不是一级品”;,表示 “产品是一级品” ;,表示 “产品是合格品”.,退 出,前一页,后一页,目 录,二、事件间的关系,(二)随机事件的运算,幂等律:,交换律:,结合律:,分配律:,De Morgan(德摩根)定律:,退 出,前一页,后一页,目 录,二、事件间的
9、关系,甲、乙都不来,甲、乙至少有一人不来,例:设A= 甲来听课 ,B= 乙来听课 ,则:,甲、乙至少有一人来,甲、乙都来,练习:甲、乙、丙三人各向目标射击一发子弹,以A、B、C分别表示甲、乙、丙命中目标,试用A、B、C的运算关系表示下列事件:,一 概率的定义(一)概率的统计定义(二)概率的古典定义二 概率的运算(一)概率的加法公式(二)条件概率公式(三)概率的乘法公式(四)事件的独立性,2 事件的概率及其运算,第一章 随机事件与概率,退 出,目 录,前一页,后一页,频率 定义:记 其中 A发生的次数(频数);n总试验次数。称 为A在这n次试验中发生的频率。,(一)概率的统计定义,例:中国国家足
10、球队,“冲击亚洲”共进行了n次,其中成功了一次,则在这n次试验中“冲击亚洲”这事件发生的频率为 =1/n,某人一共听了17次“概率统计”课,其中有15次迟到,记A=听课迟到,则,# 频率 反映了事件A发生的频繁程度。,例:抛掷硬币出现的正面的频率,历史上抛掷硬币实验的结果,* 频率的性质:且 随n的增大渐趋稳定,记稳定值为p,定义1-1: 在大量重复试验中,如果事件A出现的频率稳定地在某一常数p的附近摆动,则称常数p为事件A的概率,记为P(A)=p 性 质,2. 必然事件的概率为1,不可能事件的概率为0,(二)概率的古典定义,若随机试验E满足:试验的样本空间只包含有限个元素(有限性)试验中每个
11、基本事件发生的可能性相同(等可能性),称这种试验为等可能概型(或古典概型)。,定义1-2 设E是古典概型的随机试验,是它的样本空间,,事件A由m(m小于等于n)个不同的基本事件组成,则A的概率为,称上述定义为概率的古典定义。,例:一袋中有8个球,编号为18,其中13号为红球,48号为黄球,设摸到每一球的可能性相等,从中随机摸一球,记A= 摸到红球 ,求P(A),解: =1,2,8 A=1,2,3,例:从上例的袋中不放回的摸两球,记A=恰是一红一黄,求P(A) 解:,二、概率的运算,(一)概率的加法公式,1、互斥事件和的概率公式,2、对立事件的概率公式,3、概率的加法公式,设A、B为两个互斥事件
12、,其和的概率公式为P(A+B)=P(A)+P(B),对于两个相互对立事件,则,设A、B为两个任意事件,则P(A+B)=P(A)+P(B)-P(AB),案例:某班组织数学和英语两个学习兴趣小组,全班共45人。其中15人参加数学兴趣小组,18人参加英语兴趣小组,而参加两个兴趣小组的有6人,在该班中任意抽查一名学生,求他参加学习兴趣小组的概率有多少?,分析:设A=参加数学兴趣小组,B=参加英语兴趣小组,由题意可知,参加学习兴趣小组是参加数学兴趣小组和参加英语兴趣小组两事件之和,即A+B,事件A与B是相容的。,P(A)=15/45,P(B)=18/45,P(AB)=6/45,由概率的加法公式得:P(A
13、+B)=P(A)+P(B)-P(AB)=3/5,(二)、条 件 概 率 公 式,条件概率是概率论中一个重要而实用的概念。它所考虑的是事件 B 已经发生的条件下事件 A 发生的概率。,设A、B是某随机试验中的两个事件,且,则称事件A在“事件B已发生”这一附加条件下的概率为在事件B已发生的条件下事件A的条件概率,简称为A在B之下的条件概率,记为,1)条件概率的定义:,退 出,前一页,后一页,目 录,例 一、二制药车间同一天生产同种药品,具体数据如下 ,试求下列事件的概率:(1)抽到一件是次品(2)抽到一件是一车间生产的药品(3)抽到一件是二车间生产的药品(4)在已知抽到1件是一车间药品的条件下,它
14、又是次品。 正品数 次品数 总计第一车间 37 3 40第二车间 45 5 50总 计 82 8 90,退 出,前一页,后一页,目 录,分析:设A=抽到一件是次品,B=抽到一件是一车间生产的药品,C=抽到一件是二车间生产的药品,则,(1)P(A)=8/90=4/45;,(2)P(B)=40/90=4/9;,(3)P(C)=50/90=5/9;,(4)所求事件与(3)中的事件是不同的,其样本空间基本事件总数为40,用 P(A|B)表示,有,P(A|B)=3/40,注:由例题可以看出,事件A在“事件B已发生” 这附 加条件的概率与不附加这个条件的概率是不同的,但有,称为在事件B已发生的条件下事件A
15、的条件概率,简称为A在B之下的条件概率。,设A、B是某随机试验中的两个事件,且,则,因此,有下面的定义:,退 出,前一页,后一页,目 录,例 已知某家庭有3个小孩,且至少有一个是女 孩,求该家庭至少有一个男孩的概率,而,所求概率为,解:设 A= 3个小孩至少有一个女孩 B= 3个小孩至少有一个男孩 ,退 出,前一页,后一页,目 录,(三)、概率的乘法公式,由条件概率的定义,我们得,这就是两个事件的乘法公式,退 出,前一页,后一页,目 录,概率乘法公式的含义:两事件的积事件概率等于其中一事件的概率与另一事件在前一事件出现下的条件概率的乘积。,例3 袋中有一个白球与一个黑球,现每次从中取出一球,若
16、取出白球,则除把白球放回外再加进一个白球,直至取出黑球为止求取了n 次都未取出黑球的概率解:,则,由乘法公式,我们有,退 出,前一页,后一页,目 录,退 出,前一页,后一页,目 录,例 4 设某光学仪器厂制造的透镜,第一次落下时打破的概率为 1/2 ,若第一次落下未打破,第二次落下打破的概率为 7/10 ,若前两次落下未打破,第三次落下打破的概率为 9/10 。求透镜落下三次而未打破的概率。解:以 Ai ( i=1,2,3 ) 表示事件“透镜第 i 次落下打破”,以 B 表示事件“透镜落下三次而未打破”,有:,退 出,前一页,后一页,目 录,事件独立的定义,(四)、事件的独立性,说明:1、 两
17、个事件总是相互独立的。,如果事件A发生与否不影响事件B的发生,即P(B|A)=P(B),P(A) 0,则称事件B独立于事件A。,2、,3、,事件独立的充要条件,P(AB)=P(A)P(B),案例:根据下表考察色盲与耳聋两种疾病之间是否有联系,分析:因为P(A)=0.0050,P(B)=0.0800,P(AB)=0.0004 P(AB)=P(A)P(B)根据事件独立性的充要条件,得耳聋与色盲是相互独立的两种疾病。,目标检测,P10-11,第二章 随机变量的概率分布与数字特征,第一节 离散型随机变量及其概率分布 第二节 连续型随机变量 及其概率分布 第三节 随机变量的数字特征,第一节 离散型随机变
18、量及其概率分布,一、随机变量二、离散型随机变量三、离散型随机变量的概率分布,一、 随机变量,* 常见的两类试验结果:,X=f(e)为S上的单值函数,X为实数,* 中心问题:将试验结果数量化,定义:设随机试验E,其样本空间=e,若对每一个 有一个实数X(e)与之对应,就得到一个定义在上的实值函数X=X(e),称X(e)为随机变量,随机变量特征:1、随随机试验结果的不同而取不同的值,事前不能语言,具有不确定性。2、取某个值或落在某个范围内的值都具有一定的概率。,一、 随机变量,案例:观察下列随机试验的结果与数值之间的关系:(1)掷一颗骰子出现的点数;(2)一位隐性遗传疾病的携带者有三个女儿,则女儿
19、 中为该疾病携带者的人数;(3)采用某种新药对患者进行治疗,治愈的患者人数;(4)一个肝硬化病人的Hp感染情况;(5)对于某种新药疗效的实验观察结果。,1,2,3,4,5,6,0,1,2,3,0,1,2,10,任何一个随机试验的结果都与数值存在着联系,形成一种对应关系,定义了一种实值函数,即随机变量。,一、 随机变量,自学案例2-2,完成课堂活动,* 常见的两类随机变量,二、 离散型随机变量,定义:取值可数(有限个或可列无限个)的随机变量为离散型随机变量,离散型随机变量的案例:,(1)在本拌种任意抽取5名同学中,可能是女孩子的人数,(2)某人射击一次可能命中的环数,(3)1小时内到达某公共汽车
20、站的人数,X=0,1,2,3,4,5,Y=0,1,2,10,Z=0,1,2,怎么对这些随机变量进行研究呢?,1、判断它的取值范围以及可能取哪些值2、它取这些值的概率(取值规律),随机变量X的取值规律称为X的概率分布,简称分布,概率分布性质,三、 离散型随机变量的概率分布,定义2-3:设离散型随机变量X的所有可能取值为xi(i=1,2,),X取各个值xi的相应概率为pi(i=1,2,),则称P(X=xi)=pi(i=1,2,)为离散型随机变量X的概率分布(分布律、概率函数),常用表达方式,分布律的判断依据,三、 离散型随机变量的概率分布,案例2-4 一位隐性遗传疾病的携带者有两个女儿,则每个女儿
21、都有1/2的可能性从母亲那里得到一个致病的X染色体而成为携带者(假设父亲正常),用A,B分别表示大女儿和小女儿是携带者,试求:(1)女儿中携带者人数X的概率分布;(2)至少有一个为携带者的概率。,分析:(1)由题意可知X的可能取值为0,1,2,相应的概率分布为,三、 离散型随机变量的概率分布,概率分布为,(2)至少有一个携带者包括只有一个携带者或两个均为携带者两种情况,即,课堂练习,第二节 连续型随机变量及其概率分布,一、连续型随机变量二、连续型随机变量的概率分布三、随机变量的分布函数四、常见连续型随机变量分布,一、连续型随机变量,定义: 如果一个随机变量可以取得某一区间内的任何数值或在整个数
22、轴上取值,那么我们便称这个随机变量为连续型随机变量。,连续型随机变量的案例:,制药专业所有女孩子的身高,一批袋装50kg的大米实际重量,一批灯泡的使用寿命,对于随机变量X,存在一个非负的可积函数f (x),(-x),使得对于任意实数a,b(ab),有:则称f(x)为连续型随机变量X的概率密度函数(简称概率密度),二、连续型随机变量的概率分布,性质: 非负性:f (x) 0(-x); 归一性:,概率密度函数的判断依据,二、连续型随机变量的概率分布,性质: (3) 连续型随机变量 X 取任一常数 a 的概率为0; (4)设连续型随机变量X,对任意的a,b(a 0)为常数,则称X服从参数为 ,2的正
23、态分布,记为XN(, 2)., 非负性:f (x) 0(-x100)根据专业知识确定单、双侧正常值范围 选择百分界值 (95%,99%)选择适当的统计方法(正态分布、百分位 数法),选定同质的正常人作为研究对象,同质 正常 “足够数量” 例数过少,代表性差;例数过多增加成本,且易导致正常标准把握不严,影响数据的可靠性。一般认为每组100例以上 ;有人认为确定临床生化指标的正常值应取300500例。,单、双侧问题,过大或过小均属异常 :双侧界值例:白细胞计数仅过大或过小为异常:单侧界值 例:肺活量仅过低异常 下限 尿铅仅过高为异常 上限,选择百分界值,参考值范围的涵义:绝大多数的正常人在该范围内
24、 习惯上将“绝大多数”定义为正常人的80%、90%、95%或99% 。应根据研究目的、研究指标的性质、数据分布特征等情况综合考虑百分界值的选择。,参考值范围的估计方法,正态分布法 百分位数法 对数正态分布法,正态分布法,适于正态或近似正态分布的资料公式,双侧,单侧,(高侧),(低侧),例:某地调查了 360 名成年男子的平均血红蛋白如何估计该地成年男子血红蛋白 95 的参考值范围?95 的参考值范围:,该地成年男子血红蛋白 95 的参考值范围: 12.06 14.84 ( g/100ml)。,目标检测 三 7,(2)质量控制,在制药企业,常常应用控制图来进行某些工艺步骤的中间关键参数的控制。根
25、据3原则,控制图以时间为横轴,包括过程均值(CL)、控制上限(UCL)和控制下限(LCL),质量控制图(quality control chart),质量控制图(quality control chart)-过程受控,123456789101112131415取样时间,M+3M+2 MM-2M-3,当观测值随机地在中线附近分布,并且所有的点都在控制限之内,称为过程受控。,(2)质量控制,下列情形之一称为过程失控:1)有1个以上点在控制线外;2)有8个以上点同向移动;3)有8个以上点同时排列于中线某侧。,(2)质量控制,案例2-17 在压片工艺的片重控制中,每15分钟取10片药片进行抽检,测得片
26、重(mg)分别为3.9,3.8,4,4.05,4.1,4,4.02,3.95,4.02,3.95,4.02,3.98均数为3.982mg,标准偏差0.0836mg,试计算UCL,LCL,并说明是过程受控还是过程失控?,(3)可疑值取舍,一组测定值中,常出现个别与其他数据相差很大的可疑值,如果确定知道此数据由实验差错引起,可以舍去,否则可根据一定统计学方法决定其取舍。,常用的统计学方法:三倍标准差法、Q检验法、T检验法,(3)可疑值取舍,不需要查表的三倍标准差法原理: 3原则,服从正态分布的随机变量,测量值落在(-3,+3)。内的概率为99.73%,出现在此范围之外的概率仅为0.27%,为小概率
27、事件。在实际实验中,出现即认为不可靠,将其舍弃,讲解案例2-18,(3)可疑值取舍,案例2-18 某实验观测20次(其中漏记一次,用M表示),观测数据如下:20,20,21,20,22,20,19,24,20,22,19,21,20,28,21,20,20,22,M,20该组数据是否存在异常值?,第三节 随机变量的数字特征,在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么,X的全部概率特征也就知道了. 然而,在实际问题中,概率分布一般是较难确定的. 而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了. 因此,在对随机变量的
28、研究中,确定某些数字特征是重要的 .,随机变量数字特征,分两类:表示集中程度、平均水平数学期望、分位数、中位数、众数等;表示离散程度、变异大小方差、标准差、变异系数等。,一、随机变量的数学期望及其性质,以频率为权重的加权平均 ,反映了这7位同学高数成绩的平均状态。,引例,某7名学生的高数成绩为90,85,85,80,80,75,60,则他们的平均成绩为,随机变量所有可能取值的平均应怎么确定?,离散型随机变量,定义2-10 设离散型随机变量的概率分布为,则称 的值为随机变量X的数学期望 (期望、均值),记做E(X),E(X)=,案例2-20 某种按新配方试制的中成药在500多名病人中进行了临床试
29、验,有一半人服用,另一半人未服。一周后,有280人痊愈,其中240人服了新药,试说明新药的疗效。,定义2-11设连续型随机变量的概率密度为,连续型随机变量,则,案例2-21 设随机变量X的概率密度函数为求E(X),随机变量函数的数学期望,设,是随机变量 X的函数,,离散型,连续型,该公式的重要性在于: 当我们求Eg(X)时, 不必知道g(X)的分布,而只需知道X的分布就可以了. 这给求随机变量函数的期望带来很大方便.,数学期望的性质,性质:(1) E(c)=c, c为常数 (2)E(cX)=c*E(x) (3)E(XY)=E(X)E(Y) (4)E(XY)=EX*EY,X与Y独立,数学期望在医
30、学上的一个应用,考虑用验血的方法在人群中普查某种疾病。集体做法是每10个人一组,把这10个人的血液样本混合起来进行化验。如果结果为阴性,则10个人只需化验1次;若结果为阳性,则需对10个人在逐个化验,总计化验11次。假定人群中这种病的患病率是10%,且每人患病与否是相互独立的。试问:这种分组化验的方法与通常的逐一化验方法相比,是否能减少化验次数?,分析:,设随机抽取的10人组所需的化验次数为X,需要计算X的数学期望,然后与10比较,化验次数X的可能取值为1,11,先求出化验次数X的分布律,X=1=“10人都是阴性”,X=11=“至少1人阳性”,结论:分组化验法的次数少于逐一化验法的次数。,注意求 X期望值的步骤!,二、方差及其性质,定义2-13:设X是一个随机变量,则称E(X-EX)2为X的方差,记作DX, 为标准差。记做(X)。,E(X-EX)2=DX,随机变量的方差反映了它的取值与其数学期望的偏离程度,它是衡量取值离散程度的一个尺度。在医学统计,药物代谢动力学等领域被广泛使用。,对于离散型随机变量:对于连续型随机变量:,常用:D(X)=E(X2)-E(X)2,案例2-25 甲乙两台制丸机生产同一种药丸的直径(mm)概率分布如下:试问哪台机器性能更好,三、常见连续型随机变量分布的期望与方差,1、均匀分布:若XUa,b,则2、正态分布:若XN,,则,祝同学们学习愉快!,