正态样本异常值的判断和处理数据的统计处理和解释GB4883-85 异常值(或异常观测值)是指样本中的个别值,其数值明显偏离它(或它们)所属样本的其余观测值。 异常值可能是总体固有的随机变异性的极端表现。这种异常值和样本中其余观测值属于同一总体。 异常值也可能是由于试验条件和试验方法的偶然偏离所产生的后果,或产生于观测、计算、记录中的失误。这种异常值和样本中其余观测值不属于同一总体。 应用条件:所考查样本中诸观测值(或经过一定的函数变换后得到的值),除了个别异常值外,其余大部分值(样本主体)来自同一正态总体或近似正态总体。判断异常值的统计学原则 本标准在下述不同情形下判断样本中的异常值: 上侧情形:根据以往经验,异常值都为高端值; 下侧情形:根据以往经验,异常值都为低端值; 双侧情形:异常值是在两端都可能出现的极端值。 注:上侧情形和下侧情形统称单侧情形。判断单个异常值的检验规则 根据实际情况,选定适宜的异常值检验规则; 指定为检出异常值的统计检验的显著性水平,简称检出水平; 根据和观测值个数n确定统计量的临界值; 将各观测值代入检验规则中给出的统计量,所得值若超过临界值,则判断事先确定