精选优质文档-倾情为你奉上1.拉依达准则法(3):简单,无需查表。测量次数较多或要求不高时用。是最常用的异常值判定与剔除准则。但当测量次数=10次时,该准则失效。 如果实验数据值的总体x是服从正态分布的,则式中,与分别表示正态总体的数学期望和标准差。此时,在实验数据值中出现大于3或小于3数据值的概率是很小的。因此,根据上式对于大于3或小于3的实验数据值作为异常值,予以剔除。在这种情况下,异常值是指一组测定值中与的超过两倍的测定值。与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。在处理时,应剔除高度异常的异常值。异常值是否剔除,视具体情况而定。在统计检验时,指定为检出异常值的显著性水平=0.05,称为检出水平;指定为检出高度异常的异常值的显著性水平=0.01,称为舍弃水平,又称剔除水平(reject level)。标准化数值(Z-score)可用来帮助识别异常值。Z分数标准化后的数据服从正态分布。因此,应用Z分数可识别异常值。我们建议将Z分数低于-3或高于3的数据看成是异常值。这些数据的准确性要复查,以决定它是