.样本方差的抽样分布样本方差先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。 当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。样本方差也可以应用于从该分布的样本的连续分布的方差的估计。从一个样本取n个值y1,.,yn,其中n N,并根据这个样本估计方差。直接取样本数据的方差给出平均偏差的平均值:这里,表示样本均值由于yi是随机选择的,所以和是随机变量。 他们的预期值可以通过从群体中的大小为n的所有可能样本yi的集合进行平均来评估。 对于,有因此给出了基于因子的人口方差的估计值。被称为偏样本方差。 纠正该偏差之后形成无偏样本方差:估计值可以简单地称为样本方差。 同样的证明也适用于从连续概率分布中抽取的样本。样本方差分布作为随机变量的函数,样本方差本身就是一个随机变量,研究其分布是很自然的。 在yi是来自正态分布的独立观察的情况下,s2服从卡方分布:所以可求;和