1、第六章 样本及抽样分布第一节 总体与样本第二节 样本分布函数 直方图第三节 样本函数与统计量第四节 抽样分布前面五章我们讲述了概率论的基本内容 ,随后的四章将讲述数理统计。数理统计是具有广泛应用的一个数学分支,它以概率论为理论基础,根据试验或观察得到的数据,来研究随机现象,对研究对象的客观规律性作出种种合理的估计和判断。数理统计的内容包括:如何收集、整理数据资料;如何对所得的数据资料进行分析、研究,从而对所研究的对象的性质、特点作出推断。后者就是我们所说的统计推断问题。本书只讲述统计推断的基本内容。本章我们介绍总体、随机样本及统计量等基本概念,并着重介绍几个常用统计量及抽样分布。第一节 总体与
2、样本我们知道,虽然从理论上讲,对随机变量进行大量的观测,被研究的随机变量的概率特征一定能显现出来,可是实际进行的观测次数只能是有限的,有的甚至是少量的。因此,我们关心的问题就是怎样有效地利用收集到的有限的资料,尽可能地对被研究的随机变量的概率特征作出精确而可靠的结论。例如,我们考察某厂生产的电视机显像管的质量,在正常生产情况下,显像管的质量主要表现为它们的平均寿命是稳定的。然而,由于生产中各种随机因素的影响,各个显像管的寿命是不完全相同的。因为受到人力、物力等的限制,特别是测定显像管寿命这类的试验具有破坏性,所以我们不可能对生产的全部显像管一一进行测试,一般只是从整批显像管中取出一些显像管来测
3、试,然后根据得到的这些显像管寿命的数据来推断整批显像管的平均寿命。 我们把被研究的对象的全体称为 总体 (或 母体 ),而把组成总体的各个元素称为 个体 。在上面的例子中,该厂生产的所有显像管的寿命就是总体,而每一个显像管的寿命就是个体。代表总体的指标(如显像管的寿命)是一个随机变量,所以总体就是指某个随机变量可能取的值的全体。 从总体中抽取一个个体,就是对代表总体的随机变量进行一次试验(或观测),得到的一个试验数据(或观测值)。从总体中抽取一部分个体,就是对随机变量进行若干次试验(观测)。从总体中抽取若干个个体的过程称为 抽样 。抽样结果得到的一组试验数据(观测值),称为 样本 (或 子样
4、);样本中所含个体的数量称为 样本容量 。 假设满足下述两个条件:( 1) 随机性 为了使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的机会被抽取到,通常可以用编号抽签的方法或利用随机数表来实现。( 2) 独立性 各次抽样必须是相互独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其它各次抽样结果的影响。这种随机的、独立的抽样方法称为 简单随机抽样 ,由此得到的样本称为 简单随机样本 。例如,从总体中进行放回抽样,显然是简单随机抽样,得到的样本就是简单随机样本。从有限总体(即其中只含有有限多个个体的总体)中,进行不放回抽样,虽然不是简单随机抽样,但是正如在前面
5、我们已知的,若总体容量 很大而样本容量 较小 ( ),则可以 近似地看作是放回抽样,因而也就可以近似地看作是简单随机抽样,得到的样本可以近似地看作是简单随机样本。今后,凡是提到抽样与样本,都是指简单随机抽样与简单随机样本而言。我们指出,从总体中抽取容量为的样本,就是对代表总体的随机变量随机地、独立地进行次试验(观测),每次试验的结果可以看作是一个随机变量,次试验的结果就是个随机变量 , 这些随机变量相互独立,并且与总体服从相同的分布。设得到的样本观测值分别是 , 则可以认为抽样的结果是个相互独立的事件 发生了若将样本 , , 看作是一个维随机变量 ,则 (1)当总体 是离散随机变量,若记其分布率为 ,则样本的分布律为:(1)(2)当总体 是连续随机变量,且具有概率密度函数 时 ,样本 的概率密度为