1、第七章 随机变量的数字特征,前面讨论了随机变量的分布函数,我们看到分布函数能够完整地描述随机变量的统计规律。然而在许多实际问题中,随机变量的分布并不容易求得,并且有时不需要去完全考察随机变量的变化情况,而只需要知道随机变量的某些特征,因而不需要求出它的分布函数。 例如 1、在评定某一地区粮食产量的水平时,在许多场合只要知道该地区的平均产量; 2、在研究水稻的品种优劣时,时常是关心稻穗的平均稻谷粒数;,3、在检查一批棉花的质量时,既需要注意纤维的平均长度,又需要注意纤维长度与平均长度的偏离程度,平均长度较大、偏离程度较小,质量就较好。 从上面的例子看到,与随机变量有关的某些数值,虽然不能完整地描
2、述随机变量,但能描述随机变量在某些方面的重要特征。随机变量的数字特征就是用数字表示随机变量的分布特点,在理论和实践上都具有重要的意义。,第七章 随机变量的数字特征,第七章 随机变量的数字特征,数学期望 方差和标准差 协方差和相关系数 切比雪夫不等式及大数定理 中心极限定理,7.1 随机变量的数学期望,一、离散型随机变量的数学期望,从平均数说起,设以数据集,2,3,2,4,2,3,4,5,3,2,为总体,求其平均数(设为),=(2+3+2+4+2+3+4+5+3+2)/10,=(24+33+42+51)/10,=24/10+33/10+42/10+51/10,=3,概括得:,7.1 随机变量的数
3、学期望,一、离散型随机变量的数学期望,下面我们逐步分析如何由分布来求“均值”:(1)算术平均:如果有n个数x1,x2,xn ,那么求这n个数的算术平均,只需将此n个数相加后除以n,即 (2)加权平均:如果这n个数中有相同的,不妨设其中有ni 个取值为xi(i=1,2,k),列表为,7.1 随机变量的数学期望,一、离散型随机变量的数学期望,其实,这个“加权”平均的权数ni/n 就是出现数值 xi的频率,而频率在 n 很大时,就稳定在其概率附近。,(3)对于一个离散随机变量 X,如果其可能取值为x1,x2,xn ,若将这n个数相加后除以n作为“均值”,则肯定是不妥的,原因在于X 取各个值的概率是不
4、同的,概率大的出现的机会就大,在计算中其权数就应该大。,用取值的概率作为一种“权数”作加权平均是十分合理的。,7.1 随机变量的数学期望,1.定义 设离散随机变量X的分布律为,一、离散型随机变量的数学期望,为随机变量X的数学期望,或称为该分布的数学期望,简称期望或均值。,若级数 不收敛,则称X的期望不存在。,如果,则称,x1 x2 xn ,p1 p2 pn ,7.1 随机变量的数学期望,一、离散型随机变量的数学期望,(1) X的期望E(X)是一个数,它形式上是X的可能值的加权平均,其权重是其相应的概率,实质上它体现了X取值的真正平均,为此我们又称它为X的均值。因为它完全由X的分布所决定,所以又
5、称为分布的平均值。,(2) E(X)作为刻划X的某种特性的数值,不应与各项的排列次序有关。所以,定义中要求级数绝对收敛。,注释,所以A 的射击技术较B的好.,例:有A,B 两射手,他们的射击技术如表所示,试问哪一个射手本领较好?,解 A射击平均击中环数为,B射击平均击中环数为,例: 设有某种产品投放市场,每件产品投放可能发生三种情况:按定价销售出去,打折销售出去,销售不出去而回收。根据市场分析,这三种情况发生的概率分别为0.6,0.3,0.1。在这三种情况下每件产品的利润分别为10元,0元,15元(即亏损15元)。问厂家对每件产品可期望获利多少?,解: 设X表示一件产品的利润(单位元),X是随
6、机变量,且X的分布律为,依题意,所要求的是X的数学期望,E(X)=100.6+00.3+(-15)0.1=4.5(元),7.1 随机变量的数学期望,2.几种典型的离散型随机变量的数学期望,一、离散型随机变量的数学期望,i. X服从参数为p的(0,1)分布:,ii. 若XB(n,p),则E(X)=np;,证明:X的分布律为,E(X)=0(1-p)+1p=p;,X,0,1,P,q,p,7.1 随机变量的数学期望,2.几种典型的离散型随机变量的数学期望,一、离散型随机变量的数学期望,iii.若XP(),则E(X)=。 证明:X的分布律为,7.1 随机变量的数学期望,二、连续型随机变量的数学期望,1.
7、定义 设连续型随机变量X的概率密度为f(x), 如果 则称 为随机变量X的数学期望,记为E(X).,例:设随机变量X的概率密度函数为,试求X的数学期望,解,7.1 随机变量的数学期望,二、连续型随机变量的数学期望,2.几种典型的连续型随机变量的数学期望,i.若XR(a,b),则 E(X)=(a+b)/2.,证:X的概率密度为,7.1 随机变量的数学期望,二、连续型随机变量的数学期望,2.几种典型的连续型随机变量的数学期望,证:X的概率密度为,ii. 若XN(,2),则 E(X)=.,特别地,若XN(0,1),则E(X)=0.,7.1 随机变量的数学期望,2.几种典型的连续型随机变量的数学期望,
8、二、连续型随机变量的数学期望,证:X的概率密度为,iii.若X服从参数为的指数分布,则 E(X)=1/ .,7.1 随机变量的数学期望,三、随机变量的函数的数学期望,定理 设Y是随机变量X的函数:Y=g(X)(g是连续函数), (1) X是离散型随机变量,它的分布律为PX=xk=pk ,k=1,2, 若 绝对收敛, 则有,(2) X是连续型随机变量,它的概率密度为f(x), 若 绝对收敛, 则有,例 已知随机变量X的分布律如下求解,0.2 0.1 0.1 0.3 0.3,-2 -1 0 1 2,0.2 0.1 0.1 0.3 0.3,0.1 0.4 0.5,0 1 4,对相同的值合并,并把对应
9、的概率相加,可得,所以,或,的数学期望。,的分布律为,例:某公司生产的机器其无故障工作时间X有密度函数,公司每出售一台机器可获利1600元,若机器售出后使用1.2万小时之内出故障,则应予以更换,这时每台亏损1200元;若在1.2到2万小时之间出故障,则予以维修,由公司负担维修费400元;在使用2万小时以后出故障,则用户自己负责.求该公司售出每台机器的平均获利.,解:,设Y表示售出一台机器的获利.则,7.1 随机变量的数学期望,三、随机变量的函数的数学期望,定理:设Z是随机变量X,Y的函数Z=g(X,Y) (g是连续函数).,(1)设二维随机变量(X,Y)的分布律为,(2)设二维随机变量(X,Y
10、)的分布密度为f(x,y),若,若,则,则,例: 设(X,Y)的联合分布律如下,Z=XY,求E(Z).,解,X,Y,1 2 3,0,1,0.1,0.15 0.25,0.25 0.15 0.1,例:设(X,Y)服从A上的均匀分布,其中A为由x轴,y轴及直线x+y/2=1围成的平面三角形区域,求E(XY),解:,7.1 随机变量的数学期望,四、数学期望的性质,1.若C是常数,则 E(C)=C.,2.设X,Y是两个随机变量,若E(X),E(Y)存在,则对任意的实数a、b, E(aX+bY)存在,且有 E(aX+bY)=aE(X)+bE(Y),3.设X,Y是互相独立的随机变量,则有 E(XY)=E(X
11、)E(Y)性质2、3都可推广到有限个互相独立的随机变量之积 的情况.,7.1 随机变量的数学期望,四、数学期望的性质,性质2 E(aX+bY)=aE(X)+bE(Y),证明 (1)设离散型随机变量(X,Y)的联合分布律和边缘分布律分别为,PX=xi,Y=yj=pij, i,j=1,2,PX=xi=pi., i=1,2,PY=yj=p.j, j=1,2,则,7.1 随机变量的数学期望,四、数学期望的性质,性质2 E(aX+bY)=aE(X)+bE(Y),(2)设连续型随机变量(X,Y)的联合概率密度和边缘概率密度分别为f(x,y)和fX(x), fY(y),则,7.1 随机变量的数学期望,四、数
12、学期望的性质,性质3 如X,Y是互相独立,则 E(XY)=E(X)E(Y),证明 (1)设离散型随机变量(X,Y)的联合分布律和边缘分布律分别为,PX=xi,Y=yj=pij, i,j=1,2,PX=xi=pi., i=1,2,PY=yj=p.j, j=1,2,则,7.1 随机变量的数学期望,四、数学期望的性质,性质3 如X,Y是互相独立,则 E(XY)=E(X)E(Y),(2)设连续型随机变量(X,Y)的联合概率密度和边缘概率密度分别为f(x,y)和fX(x), fY(y),则,例:将n个球随机地放入M个盒子中去,设每个球放入各个盒子是等可能的,求有球盒子数X的期望,解:,记,i=1,2,M
13、,则,因而,例: 抛掷6颗骰子,X表示出现的点数之和,求E(X).,从而由期望的性质可得,练习,7.2 方差和标准差,引例 有两批钢筋(每批10根)它们的抗拉强度为:,第一批 110,120,120,125,125,125,130,130,135,140,第二批 90,100,120,125,125,130,135,145,145,145,可以计算出两批数据的平均数都是126, 但直观上第二批数据与平均数126有较大的偏离,因此, 欲描述一组数据的分布,单单有中心位置的指标是不够的,尚需有一个描述相对于中心位置的偏离程度的指标.,通常可用EX-E(X)2描述相对于期望的偏离,7.2 方差和标准
14、差,一、方差的定义,定义 设X是一个随机变量,若EX-E(X)2存在,则称 EX-E(X)2 为X的方差,记为D(X) , 即: D(X)=EX-E(X)2注释:(1)方差是随机变量X与其 “中心”E(X)的偏差平方的平均。它表达了X的取值与其期望值E(X)的偏离程度。若 X 取值较集中,则D(X)较小,反之,若取值较分散,则D(X)较大。 (2)应用上,常用量 ,称为标准差或均方差,记为 (X)= 。,7.2 方差和标准差,二、方差的计算公式,方差实际上是随机变量X的函数g(Y)=X-E(X)2的数学期望.于是,(1)对于离散型随机变量X,若PX=xk=pk,k=1,2,则,(2)对于连续型
15、随机变量X,若其概率密度为f(x),则,7.2 方差和标准差,二、方差的计算公式,(3) D(X)=E(X2)-E(X)2 证明:D(X)=EX-E(X)2 =E(X2-2XE(X)+E(X)2),=E(X2)-2E(X)E(X)+E(X)2,=E(X2)-E(X)2,7.2 方差和标准差,三、常见分布的方差,1. (0-1)分布的方差,定理:若PX=0=q,PX=1=p,则 D(X)=pq.,证明,X,0,1,P,q,p,7.2 方差和标准差,三、常见分布的方差,2. 二项分布的方差,定理:若随机变量X服从二项分布XB(n,p),则 D(X)=npq.,证明,7.2 方差和标准差,三、常见分
16、布的方差,3. 泊松分布的方差,定理:设随机变量X服从泊松分布XP(),则 D(X)=.,证明,7.2 方差和标准差,三、常见分布的方差,4. 均匀分布的方差,定理:设随机变量X服从均匀分布XR(a,b),则 D(X)=(b-a)2/12.,证明,7.2 方差和标准差,三、常见分布的方差,5. 指数分布的方差,定理:设随机变量X服从参数为 的指数分布,则,证明,7.2 方差和标准差,三、常见分布的方差,6. 正态分布的方差,定理:设随机变量X服从正态分布XN(,2) , 则 D(X)=2,证明,7.2 方差和标准差,常见分布的期望和方差表,7.2 方差和标准差,四、方差的性质,假定以下所遇到的
17、随机变量的方差存在: (1) 设C是常数,则 D(C)=0;(2) 设X是随机变量,a是常数,则D(aX)=a2D(X),从而 D(aX+b)=a2D(X);(3) 设X,Y是两个相互独立的随机变量,则有 D(XY)=D(X)+D(Y);,(2) 证: D(aX+b)=E(aX+b)-E(aX+b)2 = E(aX+b)-E(aX)-b2 = EaX-E(aX)2 =Ea(X-E(X)2 =a2EX-E(X)2 =a2D(X),7.2 方差和标准差,由于X,Y相互独立,XE(X)与YE(Y)也相互独立,由数学期望的性质, 2EX-E(X)Y-E(Y)=2EX-E(X)EY-E(Y)=0 于是得
18、 D(X+Y)=D(X)+D(Y).,四、方差的性质,(3)证: D(X+Y)=E(X+Y)-E(X+Y)2 =E(X-E(X)+(Y-E(Y)2 =EX-E(X)2+EY-E(Y)2 +2EX-E(X)Y-E(Y),这一性质可以推广到任意有限多个相互独立的随机变量之和的情况。,7.2 方差和标准差,四、方差的性质,若,相互独立,,为常数,则,若X ,Y 相互独立,例 设X1,X2,Xn独立同分布,E(X)=,D(X1)=2.,记,若用X1,X2,Xn表示对某物件重量的n次重复测量的误差,而2为测量误差大小的度量,公式 表明n次重复测量的平均误差是单次测量误差的1/n,换言之,重复测量的平均精
19、度比单次测量的精度高.,证明:,证,注,已知 X 的 概率密度函数为,其中 A ,B 是常数,且 E (X ) = 0.5.,求 A ,B. 设 Y = X 2, 求 E (Y ),D (Y ),练习,解 (1),(2),求,.,练一练,解 因为 相互独立,所以,而,所以,解 X的密度函数为,练一练,设随机变量X服从参数为1的指数分布,求,所以,7.3 协方差与相关系数,引 言,对于二维随机变量(X,Y)来说,数学期望E(X)、E(Y)只反映了X与Y各自的平均值,方差只反映了X与Y各自离开均值的偏离程度,它们对X与Y之间相互关系不提供任何信息.,但二维随机变量(X,Y)的概率密度f(x,y)或
20、分布律pij全面地描述了(X,Y)的统计规律,也包含有X与Y之间关系的信息.我们希望有一个数字特征能够在一定程度上反映这种联系.,7.3 协方差与相关系数,一、协方差,定义:设二随机变量(X,Y)的数学期望(E(X),E(Y)存在,若E(X-E(X)(Y-E(Y)存在,则称它为随机变量X与Y的协方差,记为cov(X,Y),即cov(X,Y)= E(X-E(X)(Y-E(Y),若X,Y为连续型随机变量,(1)用定义求:若X,Y为离散型随机变量,计算,7.3 协方差与相关系数,一、协方差, 协方差有计算公式Cov(X,Y)= E(XY)-E(X)E(Y),(2)用公式求,证 由协方差的定义及数学期
21、望的性质,得,7.3 协方差与相关系数,一、协方差, 任意两个随机变量X与Y的和的方差 D(XY)=D(X)+D(Y)2Cov(X,Y),(2)用公式求,证 由方差公式及协方差的定义,得,例,设(X,Y)有联合分布律,Y,X,01,0,1,1/4,1/4,1/3,1/6,7/12,5/12,1/2,1/2,1,求 cov(X,Y).,解,E(X)=01/2+11/2=1/2,E(Y)=07/12+15/12=5/12,E(XY)=11/6=1/6,cov(X,Y)=E(XY)- E(X)E(Y),=1/6-5/24,=1/24,例: 设(X,Y)N(1, 2 ,12, 22,),求cov(X,
22、Y),YN(2,22),,解: XN(1,12),E(X)=1, D(X)=12;,E(Y)=2, D(X)=22;,令,7.3 协方差与相关系数,一、协方差,(1) Cov(X,Y)= Cov(Y,X);,(3) Cov(aX+b,cY+d)=acCov(X,Y),,a,b,c,d为常数;,(2) Cov(X,X)= D(X);,性质,证 Cov(X,Y)= E(X-E(X)(Y-E(Y) = E(Y-E(Y) (X-E(X) = Cov(Y,X),证 Cov(aX+b,cY+d)=E(aX+b-E(aX+b)(cY+d-E(cY+d) =Ea(X-E(X)c(Y-E(Y) =acEX-E(
23、X)Y-E(Y) =acCov(X,Y),7.3 协方差与相关系数,二、相关系数,定义:设二维随机变量(X,Y)的方差D(X)0,D(Y)0,协方差Cov(X,Y)均存在,则称,为随机变量X与Y的相关系数或标准协方差.,一般地,数学期望为0,方差为1的随机变量的分布称为标准分布,故XY又称为标准协方差。,7.3 协方差与相关系数,二、相关系数,性质,1. |XY|1;,3. |XY|=1, 称之为X与Y完全相关,其充要条件为,存在常数a,b使得PY=aX+b=1.,2. XY=0,称之为X与Y不相关;,意义: |XY|=1当且仅当Y跟X几乎有线性关系。这在一定程度上说明了相关系数的概率意义。X
24、Y并不是刻画X,Y之间的“一般”关系,而只是刻画X,Y之间线性相关的程度。,说明: 假设随机变量X,Y的相关系数XY存在,当X与Y相互独立时, XY=0,即X与Y不相关,反之若X与Y不相关,X与Y却不一定相 互独立。,7.3 协方差与相关系数,二、相关系数,o,X,Y,o,o,o,X,X,X,Y,Y,Y,01,-10,恒有,其中,若上式对任何0成立,则称 依概率p收敛于,且可表示为,7.4 切比雪夫不等式及大数律,一、伯努利大数律,例如:,意思是:当,a,而,意思是:,时,Xn落在,内的概率越来越大.,当,7.4 切比雪夫不等式及大数律,切比雪夫(Chebyshev)不等式: 设随机变量X具有
25、数学期望E(X)=,方差D(X)=2 ,则对于任意正数,有,二、切比雪夫(Chebyshev)不等式,7.4 切比雪夫不等式及大数律,证明 (1)设X的概率密度为f(x),则有,(2)设离散型随机变量X的分布律为PX=xk=pk,则有,二、切比雪夫(Chebyshev)不等式,切比雪夫(Chebyshev)不等式的应用,在随机变量X的分布未知的情况下,只利用X的期望和方差,即可对X的概率分布进行估值。,例 已知正常男性成人血液中,每毫升白细胞数的平均值是7300,均方差是700,利用切比雪夫不等式估计每毫升血液含白细胞数在52009400之间的概率。,解 设X表示每毫升血液中含白细胞个数,则,
26、则,而,所以,练一练,设随机变量X的方差为2.5,利用切比雪夫不等式估计概率,例:在供暖的季节,住房的平均温度为20度,标 准差为2度,试估计住房温度与平均温度的 偏差的绝对值小于4度的概率的下界.,解,7.4 切比雪夫不等式及大数律,三、切比雪夫(Chebyshev)大数定律,设 X1,X2,是相互独立的随机变量序列,具有数学期望E(Xi) 和方差 D(Xi) i=1,2,.若存在常数 C,使得D(Xi)C(i=1,2,),则对于任意给定的 0, 恒有,证明,7.5 中心极限定理,客观背景:客观实际中,许多随机变量是由大量相互独立的偶然因素的综合影响所形成,每一个微小因素,在总的影响中所起的
27、作用是很小的,但总起来,却对总和有显著影响,这种随机变量往往近似地服从正态分布。,例如对某物的长度进行测量,在测量时有许多随机因素影响测量的结果.如温度和湿度等因素对测量仪器的影响,使测量产生误差X1;测量者观察时视线所产生的误差X2;测量者心理和生理上的变化产生的测量误差X3;显然这些误差是微小的、随机的,而且相互没有影响.测量的总误差是上述各个因素产生的误差之和,即Xi.,概率论中有关论证独立随机变量的和的极限分布是正态分布的一系列定理称为中心极限定理。,7.5 中心极限定理,一般地,在研究许多随机因素产生的总影响时,很多可以归结为研究相互独立的随机变量之和的分布问题,而通常这种和的项数都
28、很大.因此,需要构造一个项数越来越多的随机变量和的序列:,我们关心的是当n时,随机变量和Xi的极限分布是什么?,7.5 中心极限定理,设随机变量X1,X2,Xn是n个相互独立且每个都服从(0-1)分布(PXi=0=1-p,PXi=1=p),现在来求,Yn= X1+X2+Xn,这里每个Xi只能取0,1,,的分布,Yn只能取0,1,n,即Yn服从B(n,p),7.5 中心极限定理,设X1,X2,Xn同分布,且XiB(1,p),则,推论:,如果X与Y独立,且XB(m,p), YB(n,p),则 X+Y B(m+n,p),即二项分布具有可加性.,一、棣莫弗-拉普拉斯中心极限定理,(De Moivre-Laplace中心极限定理):设X1,X2,是一个独立同分布的随机变量序列,且XiB(1,p)(i=1,2,), Yn= X1+X2+Xn,则对任意一个x,-x-105的近似值.,解:易知E(Vk)=5,D(Vk)=100/12,由独立同分布的中心极限定理知,近似服从标准正态分布N(0,1),于是,练习,