1、2.1 随机变量及其分布2.2 随机变量的数学期望2.3 随机变量的方差与标准差2.4 常用离散分布2.5 常用连续分布2.6 随机变量函数的分布2.7 分布的其他特征数,第二章 随机变量及其分布,2.1 随机变量及其分布,(1) 掷一颗骰子, 出现的点数 X1,2,6. (2) n个产品中的不合格品个数 Y 0,1,2,n (3) 某商场一天内来的顾客数 Z 0,1,2, (4) 某种型号电视机的寿命 T : 0, +),2.1.1 随机变量的定义,定义2.1.1 设 =为某随机现象的样本空间, 称定义在上的实值函数X=X()为随机变量.,注 意 点 (1),(1) 随机变量X()是样本点的
2、函数,,其定义域为 ,其值域为R=(,),若 X 表示掷一颗骰子出现的点数, 则 X=1.5 是不可能事件.,(2) 若 X 为随机变量,则 X = k 、 a X b 、 均为随机事件.,即 a X b =;a X() b ,注 意 点 (2),(3) 注意以下一些表达式:,X = k= X kX k;,a b = X b.,(4) 同一样本空间可以定义不同的随机变量.,若随机变量 X 可能取值的个数为有限个或 可列个,则称 X 为离散随机变量.若随机变量 X 的可能取值充满某个区间 a, b,则称 X 为连续随机变量.前例中的 X, Y, Z 为离散随机变量; 而 T 为连续随机变量.,两
3、类随机变量,定义2.1.2 设X为一个随机变量,对任意实数 x, 称 F(x)=P( X x) 为 X 的分布函数.基本性质: (1) F(x) 单调不降; (2) 有界:0F(x)1,F()=0,F(+)=1; (3) 右连续.,2.1.2 随机变量的分布函数,2.1.3 离散随机变量的分布列,设离散随机变量 X 的可能取值为:x1,x2,xn, 称 pi=P(X=xi), i =1, 2, 为 X 的分布列.分布列也可用表格形式表示:,X x1 x2 xn ,P p1 p2 pn ,分布列的基本性质,(1) pi 0, (2),(正则性),(非负性),注 意 点 (1),求离散随机变量的分
4、布列应注意:,(1) 确定随机变量的所有可能取值;,(2) 计算每个取值点的概率.,注 意 点 (2),对离散随机变量的分布函数应注意:,(1) F(x)是递增的阶梯函数;,(2) 其间断点均为右连续的;,(3) 其间断点即为X的可能取值点;,(4) 其间断点的跳跃高度是对应的概率值.,例2.1.1,已知 X 的分布列如下:,X 0 1 2,P 1/3 1/6 1/2,求 X 的分布函数.,解:,X 0 1 2,P 0.4 0.4 0.2,解:,例2.1.2,已知 X 的分布函数如下,求 X 的分布列.,2.1.4 连续随机变量的密度函数,连续随机变量X的可能取值充满某个区间 (a, b).因
5、为对连续随机变量X,有P(X=x)=0, 所以无法仿离散随机变量用 P(X=x) 来描述连续随机变量X的分布.注意离散随机变量与连续随机变量的差别.,定义2.1.4,设随机变量X 的分布函数为F(x),则称 X 为连续随机变量,,若存在非负可积函数 p(x) ,满足:,称 p(x)为概率密度函数,简称密度函数.,密度函数的基本性质,满足(1) (2)的函数都可以看成某个连续随机变量的概率密度函数.,(非负性),(正则性),注意点(1),(1),(2) F(x) 是 (, +) 上的连续函数; (3) P(X=x) = F(x)F(x0) = 0;,(4) PaXb = PaXb = PaXb
6、= PaXb = F(b)F(a).,注意点(2),(5) 当F(x) 在x点可导时, p(x) =,当F(x) 在x点不可导时, 可令p(x) =0.,连续型,密度函数 X p(x) ( 不唯一 ),2.,4. P(X=a) = 0,离散型,分布列: pn = P(X=xn) ( 唯一 ),2. F(x) =,3. F(a+0) = F(a); P(a a 和 B = Y a 独立,,解: 因为 P(A) = P(B),P(AB) = P(A)+P(B)P(A)P(B),从中解得,且 P(AB)=3/4,求常数 a .,且由A、B 独立,得,= 2P(A) P(A)2 = 3/4,从中解得:
7、 P(A)=1/2,由此得 0a a ),例2.1.5,设 X p(x),且 p(x) = p(x),F(x)是 X 的分布函数, 则对任意实数 a0,有( ) F(a) =1 F(a)= F(a) = F(a) F(a) = 2F(a) 1,课堂练习,2.2 随机变量的数学期望,分赌本问题(17世纪) 甲乙两赌徒赌技相同,各出赌注50元.无平局,谁先赢3局,则获全部赌注.当甲赢2局、乙赢1局时,中止了赌博.问如何分赌本?,两种分法,1. 按已赌局数分: 则甲分总赌本的2/3、乙分总赌本的1/3 2. 按已赌局数和再赌下去的“期望” 分: 因为再赌两局必分胜负,共四种情况:甲甲、甲乙、乙甲、乙
8、乙所以甲分总赌本的3/4、乙分总赌本的1/4,2.2.1 数学期望的概念,若按已赌局数和再赌下去的“期望” 分, 则甲的所得 X 是一个可能取值为0 或100 的随机变量,其分布列为:,X 0 100,P 1/4 3/4,甲的“期望” 所得是:01/4 +100 3/4 = 75.,2.2.2 数学期望的定义,定义2.2.1 设离散随机变量X的分布列为P(X=xn) = pn, n = 1, 2, . 若级数,绝对收敛,则称该级数为X 的,数学期望,记为,连续随机变量的数学期望,定义2.2.2 设连续随机变量X的密度函数为p(x), 若积分,绝对收敛,则称该积分为X 的,数学期望,记为,数学期
9、望简称为期望.数学期望又称为均值.数学期望是一种加权平均.,注 意 点,例2.2.1,则,E(X) =,10.2+00.1+10.4+20.3 = 0.8.,X 1 0 1 2,P 0.2 0.1 0.4 0.3,例题2.2.3彩票问题,每张福利彩票售价5元,各有一个兑奖号。每出售100万张设一个开奖组,用摇奖器当众摇出一个6位数的中奖号码,对奖规则如下:兑奖号码与中奖号码的最后一、二、三、四、五位相同者获六等奖,分获奖金10,50,500,5000,50000元 ,兑奖号码与中奖号码全部相同获一等奖500000元.试求每张彩票平均所得奖金额?,例题2.2.2 在一个人数为N的人群中 普查某种
10、疾病,2.2.3 数学期望的性质,定理2.2.1 设 Y=g(X) 是随机变量X的函数, 若 E(g(X) 存在,则,例2.2.2 设随机变量 X 的概率分布为,求 E(X2+2).,= (02+2)1/2+(12+2)1/4+(22+2)1/4,= 1+3/4+6/4 = 13/4,解: E(X2+2),X 0 1 2,P 1/2 1/4 1/4,数学期望的性质,(1) E(c) = c,(2) E(aX) = aE(X),(3) E(g1(X)+g2(X) = E(g1(X)+E(g2(X),例2.2.3,设 X ,求下列 X 的函数的数学期望.,(1) 2X1, (2) (X 2)2,解
11、: (1) E(2X 1) = 1/3,(2) E(X 2)2 = 11/6.,2.3 随机变量的方差与标准差,数学期望反映了X 取值的中心.方差反映了X 取值的离散程度.,2.3.1 方差与标准差的定义,定义2.3.1 若 E(XE(X)2 存在,则称 E(XE(X)2 为 X 的方差,记为,Var(X)=D(X)= E(XE(X)2,(2) 称,注 意 点,X = (X)=,(1) 方差反映了随机变量相对其均值的偏离程度. 方差越大, 则随机变量的取值越分散.,为X 的标准差.,标准差的量纲与随机变量的量纲相同.,2.3.2 方差的性质,(1) Var(c)=0. 性质 2.3.2,(2)
12、 Var(aX+b) = a2 Var(X). 性质 2.3.3,(3) Var(X)=E(X2)E(X)2. 性质 2.3.1,例2.3.1 设 X , 求 E(X), Var(X).,解: (1) E(X)=,= 1,(2) E(X2) =,= 7/6,所以,Var(X) = E(X2)E(X)2,= 7/6 1 = 1/6,课堂练习,问题:Var(X) = 1/6, 为什么?,随机变量的标准化,设 Var(X)0, 令,则有 E(Y)=0, Var(Y)=1.,称 Y 为 X 的标准化.,2.3.3 切比雪夫不等式,设随机变量X的方差存在(这时均值也存在), 则 对任意正数,有下面不等式
13、成立,例2.3.2设 X,证明,证明:,E(X) =,= n+1,E(X2) =,= (n+1)(n+2),所以,Var(X) = E(X2)(EX)2 = n+1,(这里, = n+1),由此得,定理 2.3.2,Var(X)=0,P(X=a)=1,2.4 常用离散分布,2.4.1 二项分布 记为 X b(n, p).X为n重伯努里试验中“成功”的次数,当n=1时,称 b(1, p) 为 0-1分布.,试验次数为 n=4,“成功”即取得合格品的概率为 p=0.8,所以, X b(4, 0.8),思考: 若 Y 为不合格品件数,Y ?,Y b(4, 0.2),一批产品的合格率为0.8, 有放回
14、地抽取4次, 每次一件, 则取得合格品件数 X 服从二项分布.,例2.4.1 设X b(2, p), Y b(4, p), 已知 P(X1) = 8/9, 求 P(Y1).,解: 由 P(X1) = 8/9 ,知 P(X=0) = 1/9.,由此得: P(Y1) = 1 P(Y=0),所以 1/ 9 = P(X=0) =(1p)2,,从而解得: p = 2/3.,= 1- (1p)4 = 80/81.,若随机变量 X 的概率分布为,则称 X 服从参数为 的泊松分布,记为 X P().,2.4.2 泊松分布,泊松定理,定理2.4.1,(二项分布的泊松近似),在n重伯努里试验中,记 pn 为一次试
15、验中成功的概率.,若 npn ,则,记为 X h(n, N, M).,超几何分布对应于不返回抽样模型 :,N 个产品中有 M 个不合格品,,从中抽取n个,不合格品的个数为X .,2.4.3 超几何分布,记为 X Ge(p),X 为独立重复的伯努里试验中, “首次成功”时的试验次数.,几何分布具有无记忆性,即:,P( X m+n | X m ) = P( X n ),2.4.4 几何分布,负二项分布(巴斯卡分布),记为X Nb(r, p).,X 为独立重复的伯努里试验中, “第 r 次成功”时的试验次数.,注 意 点,(1) 二项随机变量是独立 0-1 随机变量之和.,(2) 负二项随机变量是独
16、立几何随机变量之和.,常用离散分布的数学期望,几何分布Ge(p) 的数学期望 = 1/p,0-1 分布的数学期望 = p,二项分布 b(n, p)的数学期望 = np,泊松分布 P() 的数学期望 = ,常用离散分布的方差,0-1 分布的方差 = p(1p),二项分布 b(n, p)的方差 = np(1p),泊松分布 P() 的方差= ,几何分布Ge(p) 的方差 = (1p)/p2,2.5 常用连续分布,正态分布、均匀分布、指数分布、伽玛分布、贝塔分布。,记为X N(, 2),其中 0, 是任意实数., 是位置参数., 是尺度参数.,2.5.1 正态分布,y,x,O,正态分布的性质,(1)
17、p(x) 关于 是对称的.,p(x),x,0,在 点 p(x) 取得最大值.,(2) 若 固定, 改变,(3) 若 固定, 改变,大,p(x)左右移动,形状保持不变., 越大曲线越平坦;, 越小曲线越陡峭.,p(x),x,0,x,x,标准正态分布N(0, 1),密度函数记为 (x),分布函数记为 (x).,(x) 的计算,(1) x 0 时, 查标准正态分布函数表.,(2) x a) =1(a); (3) P(aXb) = (b)(a); (4) 若a 0, 则 P(|X|a) = P(aX1.96) , P(|X|1.96),P(|X|1/2, 所以 b 0, 反查表得: (1.66) =
18、0.9515, 故 b = 1.66,而 (a) = 0.0495 1/2,所以 a 0, (a) = 0.9505, 反查表得: (1.65) = 0.9505, 故 a = 1.65,例2.5.2,一般正态分布的标准化,定理2.5.1 设 X N(, 2),则 Y N(0, 1).,推论:,若 X N(, 2), 则,若 X N(, 2), 则 P(Xa) =,设 X N(10, 4), 求 P(10X13), P(|X10|2).,解: P(10X13) = (1.5)(0),= 0.9332 0.5,P(|X10|2) =,P(8Xk = PXk, 则 k = ( ).,3,课堂练习(
19、1),设 X N(, 42), Y N(, 52), 记 p1 = PX 4,p2 = PY +5, 则( ) 对任意的 ,都有 p1 = p2 对任意的 ,都有 p1 p2,课堂练习(2),设 X N( , 2), 则随 的增大, 概率 P| X | ( ) 单调增大 单调减少 保持不变 增减不定,课堂练习(3),正态分布的 3 原则,设 X N(, 2), 则,P( | X | ) = 0.6828.,P( | X | 2 ) = 0.9545.,P( | X | 3 ,则 P(A) = P( X 3) = 2/3,设 Y 表示三次独立观测中 A 出现的次数,则 Y b(3, 2/3),所
20、求概率为,P(Y2) =,P(Y=2)+P(Y=3),=20/27,例2.5.5,2.5.3 指数分布,记为 X Exp(),其中 0.,特别:指数分布具有无忆性,即:,P( X s+t | X s )=P( X t ),2.5.4 伽玛分布,记为 X Ga(, ),其中 0, 0.,为伽玛函数.,称,注意点,(1),(1) = 1, (1/2) =,(n+1) = n!,(2),Ga(1, ) = Exp(),Ga(n/2, 1/2) = 2(n),2.5.5 贝塔分布,记为 X Be(a, b),其中a 0,b 0.,称,为贝塔函数.,注意点,(1),(2),B(a, b) =B(b, a
21、),B(a, b) =(a)(b) /(a+b),(3),Be(1, 1) = U(0, 1),常用连续分布的数学期望,均匀分布 U(a, b) : E(X) = (a+b)/2,指数分布 Exp() : E(X) = 1/,正态分布 N(, 2) : E(X) = ,伽玛分布 Ga(, ) : E(X) = /,贝塔分布 Be(a, b) : E(X) = a/(a+b),常用连续分布的方差,均匀分布 U(a, b) 的方差 = (b a)2/12,指数分布 Exp() 的方差= 1/2,正态分布 N(, 2) 的方差= 2,例2.5.6 已知随机变量 X 服从二项分布,且 E(X)= 2.
22、4, Var(X)=1.44, 则参数 n, p 的值为多少?,例2.5.7 设 X 表示 10 次独立重复射击命中目标 的次数,每 次射中目标的概率为0.4, 则 E(X2)的值为多少?,解:从 2.4= np, 1.44 = np(1p) 中解得,解:因为 E(X) = np = 4, Var(X)= 2.4, 所以,n=6, p=0.4.,E(X2) = Var(X)+(E(X)2= 2.4+16=18.4,设 E(X)=,Var(X)=2,则对任意常 数 C, 必有( ).,课堂练习,2.6 随机变量函数的分布,问题:已知 X 的分布,求 Y = g(X) 的分布。,例如: Y1 =
23、4X +3; Y2 = |X|; Y3 = X2 .,当 X 为离散随机变量时, Y = g(X) 为离散随机变量.,将g(xi) 一一列出, 再将相等的值合并即可.,2.6.1 离散随机变量函数的分布,2.6.2 连续随机变量函数的分布,定理2.6.1 设 X pX(x),y = g(x) 是 x 的严格 单调函数,记 x = h(y) 为 y = g(x) 的反函数, 且h(y)连续可导,则Y = g(X)的密度函数为:,例2.6.1 设 X ,求 Y =eX 的分布.,y = ex 单调可导,反函数 x = h(y) = lny,所以当 y 0 时,由此得,解:,正态变量的线性不变性,定
24、理2.6.2 设 X N (, 2),则当a 0 时, Y = aX+b N (a +b, a22).,由此得: 若 X N (, 2), 则 Y = (X )/ N(0, 1).,对数正态分布,定理2.6.3 设 X N (, 2),则 Y = e X 的服从,伽玛分布的有用结论,定理2.6.4 设 X Ga (, ),则当k 0 时, Y = kX Ga (, /k).,均匀分布的有用结论,定理2.6.5 设 X FX (x),若FX (x)为严格单调增的连 续函数,则Y = FX (X) U(0, 1).,2.7 分布的其它特征数,矩、变异系数、分位数、中位数,2.7.1 k 阶原点矩和
25、中心矩,k 阶原点矩:k = E(Xk) , k = 1, 2, .,注意: 1 = E(X).,k 阶中心矩:k = EXE(X)k , k = 1, 2, .,注意: 2 = Var(X).,定义2.7.1,2.7.2 变异系数,定义2.7.2,为 X 的变异系数.,作用:,称,CV 是无量纲的量, 用于比较量纲不同的两个随机变量的波动大小.,2.7.3 分位数,P( X xp ) = F(xp) = p,定义2.7.3,设 0 p 1,,若 xp 满足,则称 xp 为此分布 p - 分位数,,亦称 xp 为下侧 p - 分位数.,注 意 点,(1) 因为 X 小于等于 xp 的可能性为 p , 所以 X 大于 xp 的可能性为 1 p .,(2) 对离散分布不一定存在 p - 分位数.,(3),上侧 p - 分位数,若记 xp 为上侧 p - 分位数,即,则,P(X xp) = p,2.7.4 中位数,定义2.7.4,称 p = 0.5 时的p 分位数 x0.5 为中位数.,中位数与均值,相同点:都是反映随机变量的位置特征.,不同点:,含义不同.,统计中常用的 p - 分位数,(1) N(0, 1): Z , U,(2) 2(n):,(3) t (n):,(4) F (n, m):,