1、l 样本均值l 样本方差l 样本标准差l 样本偏度 5.3 统计量及其分布l 样本峰度l 次序统计量l 样本分位数l 样本中位数5.3.1 统计量与抽样分布当人们需要从样本获得对总体各种参数的认识时,最好的方法是构造样本的函数,不同的函数反映总体的不同特征。定义 5.3.1 设 x1, x2, , xn 为取自某总体的样本,若样本函数 T = T(x1, x2, , xn)中不 含有 任何 未知参数。则称 T为 统计量 。统计量 的 分布称为 抽样分布。按照这一定义:若 x1, x2, , xn 为 样 本,则 以及经验分布函数 Fn(x)都 是统计量 。而 当 , 2 未 知 时, x1,
2、x1/ 等均 不是统计量 。l 统计量是样本的一个函数l 统计量是统计推断的基础l 尽 管统计量不依赖于未知参数,但是它的分布一般是依赖于未知参数的。5.3.2 样本均值及其抽样分布 定义 5.3.2 设 x1, x2, , xn为取自某总体的样本,其算术平均值称为 样本均值 ,一般用 表示,即思考: 在分组样本场合,样本均值如何计算?二者结果相同吗? x x= (x1+ xn)/n定理 5.3.2 数据观测值与均值的偏差平方和最小,即在形如 (xic)2 的函数中 ,样本均值的基本性质:定理 5.3.1 若把样本中的数据与样本均值之差称为 偏差, 则样本所有偏差之和为 0, 即最小,其中 c
3、为任意给定常数。样本均值的抽样分布:定理 5.3.3 设 x1, x2, , xn 是来自某个总体的样本,x 为样本均值。(1) 若总体分布为 N(, 2),则xx 的 精确分 布 为 N(, 2/n) ;(2) 若总体分布未知或不是正态分布,但 E(x)=, Var(x)=2,则 n 较大时 的 渐近分布 为 N(, 2/n) 。这里渐近分布是指 n 较大时的近似分布 .中心极限定 理 (central limit theorem)x 的分布趋于的分布趋于正态分布的过正态分布的过程程1. 在重复选取容量为 n的样本时,由样本均值的所有可能取值形成的相对频数分布2. 一种理论概率分布3. 推断
4、总体均值 的理论基础 样本均值的抽样分布5.3.3 样本方差与样本标准差称为 样本标 准准 差。s*= s*2定义 5.3.3 称为 样本方差,其算术平方根在 n 不大时,常用 作为样本方差 ,其算术平方根也称为样本标准差。xi与样本均值的平均偏差平方和在这个定义中, ( xi x )2n1称为偏差平方和的 自由度。 其含义是:x在 确定后 , n 个偏差 x1x, x2x, , xnx能自由取值,因 为只有 n1个数据可以自由变动,而第 n个则不(xi x ) = 0 .称为 偏差平方和,中样本偏差平方和有三个不同的表达式:( xix )2 = xi2 (xi)2/n = xi2 nx它们都可用来计算样本方差。思考: 分组样本如何计算样本方差?