1、协方差与相关系数对于二维随机向量 (X,Y), 除了其分量 X和 Y 的期望与方差之外 , 还有一些数字特征 , 用以刻画 X与 Y之间的相关程度,其中最主要的就是协方差和相关系数。定义 1:若 E X-E(X)Y-E(Y) 存在,则称其为 X 与 Y 的协方差,记为 Cov(X,Y), 即一 协方差Cov(X, Y) = E X-E(X)Y-E(Y) . (1)第十三讲1(3) Cov(X1+X2, Y)= Cov(X1, Y) + Cov(X2, Y) ;(1) Cov(X, Y) = Cov(Y, X);协方差性质(2) 设 a, b, c, d 是常数,则Cov( aX+b, cY+d
2、 ) = ac Cov(X, Y) ;(4) Cov(X, Y) =E(XY)-E(X)E(Y) ,(5) Var(X+Y)=Var(X)+Var(Y)+2Cov(X, Y) . 当 X 和 Y 相互独立时, Cov(X, Y)=0;2若 X1, X2, , Xn 两两独立,则性质 (5)可推广到 n 个随机变量的情形:3协方差的大小在一定程度上反映了 X 和 Y相互间的关系,但它还受 X 和 Y 本身度量单位的影响。 例如:Cov(aX, bY) = ab Cov(X, Y). 为了克服这一缺点,对协方差进行标准化,这就引入了 相关系数 。4二 相关系数为随机变量 X 和 Y 的相关系数 。
3、定义 2: 设 Var(X) 0, Var(Y) 0, 则称在不致引起混淆时,记 为 。5相关系数性质证: 由方差与协方差关系, 对任意实数 b, 有0Var(Y-bX)=b2Var(X)+Var(Y)-2b Cov(X,Y ),令 则有Var(Y-bX) = 由方差 Var(Y)0, 知 1- 2 0, 所以 | |1。 6由于当 X 和 Y 独立时, Cov(X, Y)= 0 .请看下例:(2). X 和 Y 独立时 , =0,但其逆不真;但 =0 并不一定能推出 X 和 Y 独立。所以,7证明 :例 1: 设 (X,Y) 服从单位 D= (x, y): x2+y21上的均匀分布,证明: XY = 0。8所以, Cov(X, Y)= E(XY)-E(X) E(Y) = 0 .同样,得 E(Y)=0,此外, Var(X) 0, Var(Y) 0 .所以, XY = 0, 即 X 与 Y 不相关。但是, 前面已 计算过 : X与 Y不独立。9存在常数 a, b(b0),使 P Y = a+bX = 1 ,即 X 和 Y 以概率 1 线性相关 。(3). |=110