1、第七章 参数估计参数估计是这样一类问题, 即随机变量(总体) 的分布类型(或说分布函数)已知, 但分布形式中含有X未知参数, 如何通过 的样本值来估计未知参数的值或它的取值范围以及该范围包含未知参数真值的可X靠程度的问题.参数估计分为参数的点估计和参数的区间估计.一、点估计1. 点估计的提法如下 : 设已知总体 的分布函数 (其中 是未知参数)及 的一个样本X(;)FxX和一组样本值 , 建立统计量 , 用它的观察值12,nX 12,nx 12,nX作为 的近似值, 这称为参数的点估计. 观察值 称为 的点估计值, 统计x x 量 称为 的点估计量.12,nX注意, 由于估计量是随机变量, 因
2、此对于不同的样本值, 估计值一般是不同的.2. 估计方法(1) 矩估计法矩估计法的思想: 第六章中曾指出, . 1,12nPkkikiAX 1212(,)(,)Pk kgAg 因此, 我们可以以样本矩作为总体矩的估计得到一个方程组, 解该方程组便会得到未知参数的一个估计量矩估计量.矩估计法的具体做法: 设 是来自总体 的一个样本 , 是它的一组样本值. 12,nX 12,nx假设 存在, 且都是总体 分布中未知参数 的函数, 即1,2iEXk 12k,12, ,iikEAi 则令 1212121, , , . nkiikiinkkkiiXAX解此方程组, 得12k 1212,. nnX称 ,
3、分别为 的112,nX 212,nX k12,nX 12,k矩估计量, 称 分别为 的矩估计值.x ,x 12,nx 12k例 1 P178 例 2例 2 P179 例 3该例表明, 对任意总体 , 总体均值与总体方差的矩估计总为X,:221,niiX即它们不因不同的总体分布而有差异.(2) 最大似然估计法最大似然估计法的思想是: 设在总体变量 的分布形式已知(含未知参数 )的情形下, X12,k已观察到 的样本 的一组样本值 . 由于取到这组样本值的概率 (在总体变量X12,nX 12,nx p是离散型的情况下), 或 落在 的邻域内的概率 (在总体变量是连续型的, ,情况下)与参数 有关,
4、 依据“实际推断原理”, 选取的 值(称为最大似然估计值)12,k 12,k应该使 达到最大.p最大似然估计法的思想引出最大似然函数 1212,;,nnkLx .112;, , nikiiki XPXfx 当 是 离 散 型 变 量当 是 连 续 型 变 量最大似然估计法的具体做法: 设 是来自总体 的一个样本, 是它的一组样12,n 12,nx本值. 则依总体变量 的分布构造出最大似然函数 ; X1212,;,nnkLx 求解方程组 或 .0,12,iLk l0,ii方程组的解 12,nx 21, nx称为 的最大似然估计值, 而相应的估计量 ,12,knxk 112,nX 2, X称为 的
5、最大似然估计量.k12n 12,k最大似然估计具有性质: 设参数 的函数 具有单值反函数 , 又设 是(),u(),uU参数 的最大似然估计, 则 是 的最大似然估计.()u事实上, 因为 是 的最大似然估计, 所以有,1212(,;)max(,;)n nLxLx 其中 是 的一组样本值. 考虑到 , 且有 , 于是上式可写成12,nx Xuu.12 12(,;()a(;()n nUxx 这就证明了 是 的最大似然估计.()u例 3 P182 例 4例 4 P183 例 5例 5 P183 例 6例 6 P185 基于截尾样本的最大似然估计在统计问题中往往先使用最大似然估计法, 在最大似然估计
6、法使用起来不方便时再用矩估计法.习题P207-209 1 2(1) 3(1) 4 73. 估计量的基本评估标准(1) 无偏性 设 为未知参数 的估计量, 若 , 则称 为 的无偏估计12,nX ()E量.注: 称为以 作为 的估计误差. 无偏估计的实际意义是要求估计为零误差. 1 E样本均值 和样本方差 是总体期望和总体方差的无偏估计量; 也是总体方差的无偏估计 2 X2S 212niiSX量, 其中 是总体变量的期望.是总体期望和总体方差的矩估计量, 也是泊松分布、指数分布、正态分布 3 2211,innii iSXX总体的期望与方差的最大似然估计量. 前者 是无偏估计量, 后者 不是无偏估
7、计量.1ini 221niiSX例 7 P189 例 1该例表明, 对任意总体 , 样本 阶原点矩总是总体 阶原点矩的无偏估计.Xkk例 8 P189 例 2(2) 有效性(最小方差性) 设 , 都是未知参数 的112,nX 212,nX 无偏估计量, 若 , 则称 较 有效. 如果 对于固定的 , 若某个 使 达到最小, 则称1()D2 ()D为 的有效估计量.有效性表明, 在样本容量相同的情况下, 方差小的无偏估计量是相对好的估计量.(3) 相和性(一致性) 设 是未知参数 的估计量, 若 依概率收敛于 , 即12,nX 对于任意正数 , ), 则称 为 的相和估计量(或一致估计量).li
8、mnP注: 相和性表明, 若估计量不具有相和性, 那么不论样本容量 有多么大, 都不能将 估计得足够准确. 因此, 不具 1 n有相和性的估计量是不可取的.样本均值和样本方差是总体期望和总体方差的相和估计量; 也是 的相和估计量. 用矩估 2 12niiXDX计法得到的许多估计量都具有这种性质. 最大似然估计量在一定条件下也具有相和性 .样本 阶原点矩 及其函数 是总体 阶原点矩 和 的相和估计 3 k1nkkiiAX12(,)kgA k12(,)kg量.总的来说, 具有相和性且方差小的无偏估计量才是好的估计量.习题P209-210 9 10 11(1)二、区间估计1. 区间估计的提法如下:
9、作为对未知参数的估计, 显然结果取得宽泛一些更合理. 另外, 对结果范围包含未知参数真值的可信程度应予以说明. 找到这个范围并判断未知参数真值落在这个范围的可信度的过程, 称为参数的区间估计. 这个范围通常以区间的形式表示, 称为置信区间.2. 基本概念置信区间 设 是总体 分布中的未知参数, ( 是 的可能取值范围). 对于给定的正数X( ), 若由样本 的确定的两个统计量 和0112,nX 12,nX, 对任意 满足2nX ( ), (7.1)P则随机区间 称为 的置信水平为 的双侧置信区间, 和 分别称为 的置信水平为 的双,1 1侧置信区间的置信下限和置信上限, 称为置信水平.若 ,
10、对任意 满足12,nX , 1P则随机区间 称为 的置信水平为 的单侧置信区间, 称为 的置信水平为 的单侧置信,11区间的单侧置信上限.若 , 对任意 满足12,nX , 1P则随机区间 称为 的置信水平为 的单侧置信区间, 称为 的置信水平为 的单侧置信,11区间的单侧置信下限.(7.1)式的含义如下: 若反复抽样多次 (设各次抽样的样本容量相等, 都是 ), 则每组样本值都会确定一个区间 , 每个这样的区间要么n)包含 的真值, 要么不包含 的真值(参见右图). 按伯努里大数定理, 在这样多的区间中, 包含 的真值的约占 , 不包含 的真10()%值的约占 . 例如, 若 , 反复抽样
11、1000 次, 则得到的10%.1000 个区间中不包含 的真值的约仅为 10 个.3. 区间估计的方法求未知参数 的置信区间的做法如下: 设 是来自总体 的一个样本, 是它12,nX X12,nx的一组样本值. 则寻求一个样本 的函数12,nX,12(,;)nWX它包含参数 , 但不包含其它未知参数, 并且 的分布已知且不依赖于任何未知参数(当然也不依赖于待W估参数 );对于给定的置信水平 , 定出两个常数 , 使1ab;12(,;)1nPaX若能从 得到等价的不等式 , 其中 ,12(,;)naWX 12(,)nX都是统计量, 那么 就是 的一个置信水平为 的置信区间.12(,)n (,函
12、数 的构造通常可以从 的点估计着手考虑.12(;)n 显然 的置信水平为 的置信区间不唯一. 置信区间小表示估计的精度高.例 9 P192 例4. 正态总体均值与方差的区间估计(一)几个常用统计量及其分布设 是来自正态总体 容量为 的的样本, 样本均值 , 样本方差12,nX 2,Nn1niiX, 则有221niiS , ; 2,XNn:0,1/XN:且 ; 21S ./XtnS:(二) 单个正态总体 的情形2,N设给定置信水平为 , 并设 是来自总体 的一个样本, 分别是样本112,nX 2N2,XS均值和样本方差.1o. 均值 的置信区间若 已知, 由于统计量 , 所以 的置信水平是 的一
13、个置信区间为201XUNn:1. 它是由 确定的; 的置信水平是 的(单侧)置信区间为2xzn21PUz1或 . ,xn若 未知, 由于统计量 , 所以 的置信水平是 的一个(双侧)置信区间21XTtnS:1为 . 它是由 确定的; 的置信水平是 的(单侧)置信区21sxtn2Pt间为 或 .,t,1sxtn实际问题中, 总体方差未知的情况居多.例 10 P196 例 1例 11 P2032o. 方差 的置信区间2若 未知, 由于统计量 , 所以 的置信水平是 的一个(双侧)置2211nSn:21信区间为 . 它是由 确定的; 12,nss 221 nP的置信水平是 的(单侧)置信区间为 或
14、.2120,ns2,1ns这时实际中常见的情形.例 12 P197 例 2例 13 P204 例例 14 P203(三) 两个正态总体 的情形221,N设给定置信水平为 , 并设 是分别来自总体 和1212,;,nnXY 211,XN:的两个样本, 它们相互独立. 又设 分别为总体一、二的样本均值, 分别为总22X: 2S体一、二的样本方差.1o. 均值差 的置信区间12若 与 已知, 由于统计量 , 所以 的置信水平是21121201XUNn:12的一个(双侧)置信区间为 . 它是由 确定的. 2112xz2UzP的置信水平是 的(单侧)置信区间为 或122112,xzn.211,xzn若
15、未知, 由于统计量 , 其中21 121212WXTtnSn:, 则 的置信水平是 的一个(双侧)置信区间为221WnS12. 它是由 确定的. 的置121212wtnxs 12PTtn12信水平是 的(单侧)置信区间为 或121212,wtxs .121212,wtnxs 例 15 P198 例 3例 16 P199 例 42o. 方差比 的区间估计21由于统计量 , 则 的置信水平是 的一个(双侧)置信区间为2112/,SFn:211. 它是由22111212, , ,nss 确定的. 的置信水平是 的(单侧)置信区12122 21, ,PFFn211间为 或 .212, ,1Fns21120,Fns例 17 P200 例 5(四)0-1 分布参数的区间估计自修习题P210-211 14 16 17 21