1、第三节、 实验室质量控制 实验室资质认定评审准则: 实验室应有质量控制程序和质量控制计划以监控检测和校准结果的有效性,可包括(但不限于)下列内容: a) 定期使用有证标准物质(参考物质)进行监控和 /或使用次级标准物质(参考物质)开展内部质量控制; b) 参加实验室间的比对或能力验证; c) 使用相同或不同方法进行重复检测或校准; d) 对存留样品进行再检测或再校准; e) 分析一个样品不同特性结果的相关性。 检测 /校准结果的质量是实验室始终关注的重点,实验室建立管理体系并使之有效运行,其目的就是为了确保检测 /校准的质量。但影响检测报告质量的因素又是很多的,在检测 /校准过程中由于诸种因素
2、的变化会使得检测质量不可能始终是恒定的,质量可能发生突然变化或渐渐发生变化,这种质量的下降如超出标准、规范的要求限度,将会给检测 /校准质量带来风险。对质量的这种变化如没有以有效技术的手段进行控制,只能在这种变化发生很久以后才会被发现,而这时可能已经给检测 /校准带来较大影响或损失。因此,必须采取适时监控的方法,发现突变或渐变的质量下降。其控制方法可以通过对数据的监视和分析,连同纠正措施,包括使用核查标准,控制图或其他等效内容,使测 量过程能连续地保持在准确度受控的规定范围之内。 在实验室的管理中,强调对各个过程处于受控状态,但受控不等于没有变异,即使在相同条件下的每次测量也有差异,所以变异是
3、客观存在的。变异有其统计规律,一般分正常变异(即受控状态下的变异)和异常变异。正常变异是不可避免的,尽管多种因素控制得很好,检测结果也有离散。正常变异是找不出原因的,也没有必要去找, 可以 用不确定度来表示其变化区间;异常变异是人、机、样、法、环、溯的一个或几个因素发生变化引起的,这正是质量控制的对象。在检测过程中,不是不允许出现变异,而是要控制它,强 调找出原因,针对原因采取改进措施(纠正和预防措施) 为确保检测结果的有效性,实验室应有质量控制程序和和质量控制计划。以监控检测 /校准工作的全过程。因此,实验室应经常利用内部手段,如对 标准物质(样品) 盲样检测、留样检测、人员比对、方法比对等
4、验证检测工作的可靠性;要借助外部力量,如实验室间比对和参 加能力验证等验证 。在标准更新、人员交替、设备变化和检测质量波动的情况下,尤其应加强技术校核工作。 一、 名词和术语解释 测量结果的 重复性: 在相同测量条件下,对同一被测量进行连续多次测量所得结果之间的一致性。 注: 1 这些条件称为重复性条件。 2 重复性条件包括: 相同的测量程序; 相同的观测者; 在相同的条件下使用相同的测量仪器; 相同地点; 在短时间内重复测量。 3 重复性可以用测量结果的分散性定量地表示。 测量结果的 复现性: 在改变了的测量条件下,同一被测量的测量结果之间的一致性。 注: 1 在给出复现性时,应有效地说明改
5、变条件的详细情况。 2 改变条件可包括: 测量原理; 测量方法; 观测者; 测量仪器; 参考测量标准; 地点; 使用条件; 时间。 3 复现性可用测量结果的分散性定量地表示。 4 测量结果在这里通常理解为已修正结果。 实验标准 偏 差 : 对同一被测量作 n 次测量,表征测量结果分散性的量 s 可按下式算出: 1n )x(xsn1i2i 式中: xi-第 i 次测量的结果; x -所考虑的 n 次测量结果的算术平均值。 自 由度:统计学上的自由度是指当以样本的统计量来估计总体的参数时, 样本中独立或能自由变化的资料的个数,称为该统计量的自由度。 统计学上的自由度包括两方面的内容: 首先,在估计
6、总体的平均数时,由于样本中的 n 个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以其自由度为 n。 在估计总体的方差时,使用的是离差平方和。只要 n-1 个数的离差平方和确定了, 方差也就确定了;因为在均值确定后,如果知道了其中 n-1 个数的值,第 n 个数的值也就确定了。这里,均值就相当于一个限制条件,由于加了这个限制条件,估计 总体方差的自由度为 n-1。 T 分布 t 分布又称为学生 t-分布。其推导由威廉 戈塞于 1908 年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生( Student)这一笔名。之后 t 检验以及相关理
7、论经由罗纳德 费雪的工作发扬光大,而正是他将此分布称为学生分布。 t 分布有如下特征: 1以 0 为中心,左右对称的单峰分布; 2 t 分布是一簇曲线,其形态变化与 n(确切地说与自由度 )大小有关。自由度 越小, t 分布曲线越低平;自由度 越大, t 分布曲线越接近标准正态分布( u 分布)曲线,如图 4.1。当 n 时, t 分布就变成了正态分布。 对应于每一个自由度 ,就有一条 t 分布曲线,每条曲线都有其曲线下统计量 t 的分布规律 ,计算较复杂。 因此,统计学家上根据自由度 的大小与 t 分布曲线下面积的关系, 建立 t 分布 表 ,以便于应用。表中的横标目为自由度 ,纵标目为概率
8、 P,表中数字表示自由度 为某值时,P 为某值时, t 的界值。 t 分布曲线下面积为 95%或 99%的界值不是一个常量,而是随着自由度大小而 变化的,分别用 ,05.0t 和 ,01.0t 表示。 图 4.1 自由度为 1、 5、 的 t 分布 T 分布的函数为:xsXxt ( 5.1) X 为标准值时,nsSx ( 5.2) X 为另一测量值 2x 时,212121 nnnnsSxx( 5.3) 当 2n 时 ( 5.3)就是( 5.2) 二、 实验室间比对 实验室间比对是按照预先规定的条件,由两个或多个实验室对相同或类似的测试样品进行检测的组织、实施和评价,从而确定实验室能力、识别实验
9、室存在的问题与实验室间的差异 , 是判断和监控实验室能力的有效手段之一。 ( 1) 能力验证: (多 各 实验室 ) 能力验证是指利用实验室间比对确定实验 室的校准或检测能力或检查机构的检测能力 ,一般能力验证由主持评审的机构 和权威的技术机构 组织 。 ( 2) 测量审核: (参加实验室与参考实验室 ) 测量审核是指实验室对被测物品(材料或制品)进行实际测试,将测试结果与参考值 (由或得测量审核认可的机构提供) 进行比较的活动。 ( 3) 实验室自行组织的比对: 按照预先规定的条件,由两个或多个实验室对相同或类似的测试样品进行检测的组织、实施和评价,从而确定实验室能力、识别实验室存在的问题与
10、实验室间的差异是判断和监控实验室能力的有效手段之一。两个实验室条件(硬件、人员能力 、设备能力 等等)应当大致相当,如何条件差别很大, 比对结果意义不大。 ( 4) 实验室内部的技术校核: 核查实验室人员技术 水平 ,一般的方式 如下 : 标准物质(样品)盲样检测 : 由检测人员对 标准物质(样品) 盲样检测 , 将检测结果 与标准值比较 ,以验证检测 测量能力 。 样品复测 : 某一样品的检测完成后,再用相同的方法对该样品的相同参数进行复测,将两次的检测结果进行对比,以验证检测结果的可靠性。 人员比对: 由不同的检测人员对某一样品进行相同方法的检测, 将两次的检测结果进行对比,以验证检测结果
11、的可靠性。 样品不同特性的相关性检验 : 同一样品的某些参数之间往往有一定的内在联系,对这些参数的检测结果进行比较,亦可作为判断检测结果可靠性的方式之一。若相关参数检测结果相互矛盾,应查找原因,对有疑问的项目进行复测,使相关参数间的关系趋于合理。 三、实验室比对的实施 ( 1)比对活动的文件 组织者应负责活动按计划、规范、持续地开展。所有活动和程序都应文件化,使其满足评审准则的要求。 组织者应考虑检测物品的包装和运输方法是否恰当,并能保证和保护检测物品的均匀性、稳定性及特性,以保证能力验证的可靠性。 组织应制定作业指导书,它是提供给参加实验 室在计划中必须遵循的所有方面的详细指令。它应详细阐述
12、可能对所给检测物品或材料的检测产生的主要影响因素,如操作者、物品或材料的性质、设备状态、检测项目、检测程序和检测日程等,还有检测或校准结果的记录(数据、图表和软件 )和报告的具体指导 (例如单位、有效数字的位数、报告内容和格式及结果期限等 )。 数据的分析、处理及结果的评价。 ( 2) 比对 参考 值的设置 确定指定值按照不确定度 大小 排序, 一般 按以下按次序使用下列各值: 已知值 : 由专门的检测物品配方 (如用制造或稀释等 )决定的结果。 有证参考值 : 由定义法确定 (用 于定量检测 )。 参考值 : 与一个可溯源到一个国家或国际标准的标准物质或标准并行分析,测量或比对检测物品所确定
13、的值。 从 参考 实验室得到的公议值 : 参考 实验室利用已知的具有高精密度和高准确度的,并可与通常使用的方法相比较的有效方法,确定试验中的被测量。 从参加实验室得到的公议值 : 采用参加实验室检测结果的统计量 (加权平均值、几何平均值、中位值或其它稳健度量等定量值或一个预定的多数百分比公议值即定性值等 )来作为公议值。当将参加实验室的检测结果用来确定为公议值 (即指定值 )时,必须考虑到应使极端结果的影响减至最 小。这可用稳健统计法在计算之前剔除离群值来实现。 ( 3) 实验室 能力统计 方法 在实验室比对中,对定性结果,通常无须进行数据分析。而对定量结果常用的数据分析方法列举下列,供实验室
14、参考: 实验室偏移估计值 当相应专业标准规定了测量结果允差,则可按专业标准方法的规定进行测量审核满意度评定。按下式计算 Z 值: 0xxZ 式中: x -测量结果; 0x -被测物品的参考值; -标准中规定的允差。 判定方法: Z 1,则判定申请单位的测量结果为满意。此方法也适用于结果是相对量的情况。 Z 比分数法: NIQRXxZ 式中: Z-参加实验室的结果; X-指定值; NIQR-标准化四分位距 0.7413IQR。 判定方法: |Z| 2 ,表明该实验室的能力满意。 2 |Z| 3 ,表明该实验室存在问题 ,应鼓励实验室分析检查其能力。 |Z| 3 , 表明该实验室处于离群状态 ,该
15、实验室的能力不满意 ,应采取有效的纠正措施 。 En 值 法: 22 reflab UUXxEn 式中: x 参加实验室的测量结果; X 参考实验室的参考值(指定值); Ulab 参加实验室所报告的测量结果的扩展不确定度; Uref 参考实验室所报告的参考值(指定值)的扩展不确定度。 注: Ulab和 Uref 两者的置信概率应相同(一般为 95%)。 判定方法: 当 nE 1,比对结果满意,通过。 当 nE 1,比对结果不满意,不通过。 对出现 nE 1 的实验室,必须仔细查找原因,采取纠正措施。必要时,可重新进行测量,否则,不能参与最后的统计比对。也就是说,该实验室的该项校准能力验证不能通
16、过,即不具备该项校准能力。对出现 0.7 nE 1 的实验室,建议采取预防措施。 T 检验法: snXxt ( 标准值与 一组数据 比较 ) 式中: x 参加实验室的测量结果; X 参考实验室的参考值(指定值); n-自由度 s-参加实验室测量结果 的标准偏差 如果采用 或两组数据的平均值,则用212121 nn nns xxt 2 )()( 21222211 nn xxxxs式中: x1 和 x2 分别为两组数据的平均值 ; n-自由度 s-参加实验室测量结果 的标准偏差 t 检验的目的就是比较一组数据与一标准值(或两组数据的平均值)之间是否存在显著性差异的检验。 判定方法: t-检验统计量
17、小于等于置信概率 0.95 的临界值时,则标准值(或另一组测量结果) 与被检验的测量结果在置信概率为 0.95 时统计一致, 满意。 t -检验统计量大于置信概率 0.95 的临界值时, 因此二者平均值之间存在显著性差异,二个值之间存在系统误差 ,不满意。 按临界值( CD 值)评定 : 当实验室对检测和测量的不确定度缺乏正确的评定,而用于该测量的标准方法提供有可靠的重复性标准偏差 r 和复现性标准偏差 R 时,可采用本方法对测量审核结果进行判定。 )1()8.2()8.2(21 22 nnCD rR )1(22nnXx rR 式中: R -复现性标准偏差 r -重复性标准偏差 x-参加实验室
18、的测量结果; X-参考实验室的参考值(指定值); n-测量次数 判定 方法 : 实验室重复条件下 n次测量值 x与参考实验室给出的被测物品参考值 X之差小于临界值 CD,则该申请单位的测量结果判定为满意。 ( 4) 比对数据保密: 能力验证的目的主要是帮助参加者改善其能力,但在参加者中可能存在一种倾向,即对其能力提供一个虚假的良好印象。例如,在实验室之间可能发生窜通,以至不 提交真正独立的数据。假如实验室 日 常进行的是单次分析,但在能力验证中要求报告样品的重复测量值及其平均值,或就一个特定计划进行附加的重复试验,这时实验室也可以给出一个其能力的虚假印象 (不是真实的测量数据 ),因此,为确保
19、能力验证活动的真实性,应尽可能避免出现窜通和伪造行为的发生。参加实验室应有责任避免欺骗行为,以确保能力验证的真实性。 ( 5)比对 报告 在 比对 计划完成后, 组织 者应写出总结报告,其内容根据具体计划的目的和类型而有所不同。但共同特点是应清晰和全面,应包含所有实验室结果分布的数据,以及各参加者能力的说明。 报告通常应包含下列信息。 组织 机构 名称、地址、负责人、邮编、电话、 E-mail 等 联系方式 。 指定值 及 指定值的溯源性和不确定度。 参加实验室的检测结果。 比对结果的 技术分析。 比对 结果的利用等 四、 计算实例 1.Z 比分数法: 此方法使用前提:测试结果数据符合正态分布
20、 NIQRXxZ 式中: Z-参加实验室的结果; X-中位值 ; NIQR-标准化四分位距 0.7413IQR。 Q3-为高四分位数值,即高于结果四分之三处的最近值 Q1-为低四 分位数值,即低于结果四分之一处的最近值 实例:有 16 各实验室参加能力验证,将其测量数据按递增排列,得到如下数据: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 6.0 6.1 6.1 6.2 6.4 6.4 6.5 6.6 6.7 6.7 6.7 6.8 6.9 7.0 7.2 8.5 Q1=6.2 Q1=6.2 IQR=Q3 Q1=6.8 6.2=0.6 NIQR=0.74130
21、.6=0.448 X 中 =6.65 5.1448.0 65.60.61 Z 2.44 4 8.0 65.65.816 Z 根据判定方法: |Z| 2 ,表明该实验室的能力满意。 2 |Z| 3 ,表明该实验室存在问题 ,应鼓励实验室分析检查其能力。 |Z| 3 , 表明该实验室处于离群状态 ,该实验室的能力不满意 ,应采取有效的纠正措施。 Z1验证结果为满意 而 Z16验证结果为不满意 2. En值 法: 22 reflab UUXxEn 式中: x 参加实验室的测量结果; X 参考实验室的参考值(指定值); Ulab 参加实验室所报告的测量结果的扩展不确定度; Uref 参考实验室所报告的
22、参考值(指定值)的扩展不确定度。 注: Ulab和 Uref 两者的置信概率应相同(一般为 95%)。 实例:下 表为有参考实验室(编号为 0)时七个校准实验室间关于 1V 直流电压测量的量值比对结果,测量结果扩展不确定度的置信概率均为 95%。 表 1V 直流电压比对结果 实验室编号 测量结果 -参考值 (V) 扩展不确定度 (V) En 0(参考实验室) 0 1.0 0 1 -0.1 1.5 -0.55 2 2.0 2.0 0.89 3 -1.5 1.5 -0.83 4 2.5 1.0 1.77 5 0.5 1.5 0.28 6 -2.5 3.0 -0.79 根据判定方法: 当 nE 1,
23、比对结果满意,通过。 当 nE 1,比对结果不满意,不通过。 对出现 nE 1 的实验室,必须仔细查找原因,采取纠正措施。必要时,可重新进行测量,否则,不能参与最后 的统计比对。也就是说,该实验室的该项校准能力验证不能通过,即不具备该项校准能力。对出现 0.7 nE 1 的实验室,建议采取预防措施。 从表可见,在所有参加能力验证的校准实验室中,除 4 号实验室的 nE =1.77 1 以外,其余实验室的 nE 皆小于 1,具备了相应的校准能力。实际上, 4 号实验室报告的不确定度为 1.0V,远小于 6 号和 2 号实验室,但能力验证却没有通过。可见,参加实验室所报告的不确定度 并不能完全反映
24、其所具备的校准能力。 3. T 检验法: snXxt ( 比较 一组数据与一标准值) 式中: x 参加实验室的测量结果; X 参考实验室的参考值(指定值); n-自由度 s-参加实验室测量结果 的标准偏差 如果采用 或 两组数据的平均值 ,则用212121 nn nns xxt 2 )()( 21222211 nn xxxxs式中: x1 和 x2 分别为 两组数据的平均值 ; n-自由度 s-参加实验室测量结果 的标准偏差 t 检验的目的就是比较 一组数据与一标准值(或 两组数据的平均值 ) 之间是否存在显著性差异 的检验 。 实例 1 某测量值 与 标准值比较: 某样品的参考值为 10.60%。现为检验实验室的测量水平,对该样品作了十次测定,得x =10.52%, S=0.050%,问:是存在否 显著性差异 ? 计算: 1.5100 0 5 0.0 60.1052.10 t 查 T 分布 表:当自由度 =n-1=9 时 t( 9, 0.05) =2.26 由于 t=5.1 t =2.26 所以测量数据存在 显著性差异,拒绝。 实例 2 对同一样品用两种方法分析 数据比较 : 得到百分含量的数据如下: