1、第十二章筛检和诊断试验,今日要点,筛检和诊断试验的概念筛检和诊断试验的研究方法*筛检和诊断试验的评价*筛检和诊断试验判断标准的确定ROC曲线提高试验效率的方法,案 例,一位54岁的美国高中教师,前往她的社区医生处进行年度体检。主诉既往身体健康,无不适。一年前曾有一次短暂的发热史,未经治疗已经缓解。医生对其进行了身体检查,包括乳房触诊、妇科查体等均无异常。建议患者进行乳腺钼钯X线检查,结果提示异常。于是进一步进行细针穿刺抽吸乳腺组织活检(Fine-needle aspiration, FNA)检测,FNA病理结果显示有癌细胞。于是患者被安排1周后手术。手术的同时又做了病理切片,结果确诊为乳腺癌。
2、注:FNA检测结果可分为以下三种:一是良性(不存在癌细胞);二是可疑(有变异细胞还不确定是否为癌细胞);三是存在癌细胞。,问 题,1.该患者无不适主诉,乳房触诊等物理诊断均无异常,为何医生还要对其行乳腺钼钯X线检查?2. 既然钼钯X线检查已提示为异常,为何还要进一步行FNA检测,增加患者的痛苦、创伤和诊疗费用?3. 手术活检是乳腺癌确诊的最终依据,假设该患者的X线检查为异常,而FNA检查为正常,是否有必要进一步行外科手术活检?,提 示,50岁以上的妇女,在乳房触诊正常的情况下,患乳腺癌的几率为0.3%钼钯X线检测异常则有13%的可能患乳腺癌FNA检测结果为阳性,患乳腺癌的可能性为64%4.对于
3、乳腺癌触诊无可疑包块而钼钯X线摄片异常者,若FNA检查为正常,则有99%的把握可排除乳腺癌即只有1%的可能性是乳腺癌。那么外科手术可考虑暂时不做,建议其定期体检、随访,复查乳腺钼钯X线。,第一节 概 述,(筛检),(治疗),(诊断),筛检与诊断步骤示意图,实际患病者,可疑有病但实际无病者,无该病,定期,1.定义:是在大量表面上无病的人群中通过快速简便的试验、检查和其他检测措施,去主动发现那些未被识别的、可疑的病人或有缺陷的人。简单、廉价、快速、安全、易被群众接受良好的可靠性和准确性,筛检(screening),(1)按对象范围 整群筛检(mass screening):一般人群 目标筛检(ta
4、rgeted screening):特殊人群 (2)按筛检项目的多少 单项筛检(single screening) 多项筛检(multiple screening),2、筛检的分类,诊断(diagnosis),不仅包括各种实验室检查,也包括病史体检所获得的临床资料、X线、超声等各种公认的诊断标准,并且利用这些资料和技术标准对疾病和健康状况做出确切的结论。诊断试验(diagnostic test):泛指在诊疗过程中进行的各种以诊断为目的的检查手段。是把病人与可疑有病但实际无病的人区别开来。,筛检试验与诊断试验的区别,筛检的目的及意义,达到二级预防:“三早”措施通过筛检确定高危人群,及早从病因学角
5、度采取措施,实现疾病一级预防的目的。 了解疾病的自然史,开展流行病学监测,筛检应用的原则,被筛检的疾病或缺陷是当地当前重大的卫生问题被筛检的疾病有有效的治疗或预防方法有进一步确诊的方法与条件有明确的疾病自然史该病有较长的潜伏期或领先时间预期有良好的筛检效益,确定“金标准”选择研究对象确定样本量试验结果与金标准分类结果比较,筛检或诊断试验的研究设计要点,1.确定“金标准”,金标准:指可靠的、公认的、能正确地将有病和无病区分开的诊断方法。,冠心病: 冠状动脉造影肿瘤: 病理学检查不明原因的腹痛: 手术探查,金标准具有创伤性,因此探求一些新的诊断方法(诊断试验),并比较其与金标准的差别、得失及推广价
6、值有现实意义。,2. 选择研究对象,病例的代表性:临床各型 ( 轻、中、重 ) 临床各期 ( 早、中、晚 ) 有无并发症,对照组,* 健康人* 未患该病而患其他疾病的病人,病例组,待评价筛检试验的灵敏度待评价筛检试验的特异度容许误差:0.05或0.01,3、样本含量估算,当灵敏度和特异度均接近50%时,可用近似公式1计算样本量。 当灵敏度或特异度小于20%或大于80%时,因其趋向偏态分布,可用公式2计算样本量。,灵敏度用于估计病例组人数,特异度用于估计对照组人数。 两组样本量都至少在30例以上,才能保证结果受机会影响的程度在可接受的范围内。,选择检查结果最接近金标准判断结果的界值作为正常值标准
7、正态分布法 对数正态分布法 百分位数法,4. 确定正常值,案 例,Bibbo等人选择114例乳腺触诊无可疑包块而钼钯X线检查异常的女性病例,先行FNA检测,随后在同侧乳腺做了手术活检,结果见表1。 表1 FNA检测与手术活检诊断乳腺癌的比较 手术活检FNA检测 乳腺癌 非乳腺癌 合计 阳性 14 8 22 阴性 1 91 92 合计 15 99 114问题4:对FNA检测乳腺癌的真实性如何进行评价?,目标人群,诊断和筛检试验的评价程序,第二节 诊断试验和筛检试验的评价,评价:真实性、收益、可靠性,第二节 诊断试验和筛检试验的评价,1、真实性(validity),真实性:指测量值与实际值(金标准
8、的测量值)符合的程度。灵敏度(sensitivity,Se):反映对疾病的检出能力。特异度(specificity,Sp):反映对非病例的排除能力。假阴性率(漏诊率)假阳性率(误诊率)似然比(likelihood ratio,LR)正确诊断指数(r,约登指数),评价试验的真实性,假阴性率 c/a+c,特异度 d/b+d,灵敏度 a/a+c,假阳性率 b/b+d,似然比 (likelihood ratio, LR),即病人中出现某种试验结果的概率与非病人中出现相应结果的概率之比,说明病人出现该结果的机会是非病人的多少倍。是一个相对稳定的综合性评价指标,不受患病率影响。,阳性似然比 筛检试验结果的
9、真阳性率与假阳性率之比。比值越大诊断价值越高。,阴性似然比 筛检试验结果的假阴性率与真阴性率之比。比值越小诊断价值越高。,r (灵敏度特异度)1 1(假阳性率假阴性率) r值范围在01之间 r越大,准确性越高,与实际越符合,正确诊断指数(Youdens index,r),评价结果,灵敏度=93.33% 假阴性率=6.67%特异度=91.91% 假阳性率=8.09%约登指数=0.8524阳性似然比=11.54阴性似然比=0.07,案例分析,甲乙两位放射科医生阅读相同的乳腺癌钼钯X线摄片100张,读片结果列于表4。 表4 两位放射科医生对100张乳腺钼钯X线摄片的读片结果 甲医生乙医生 正常 异常
10、 合计 正常 40(a) 20(b) 60(r1) 异常 4 (c) 36(d) 40(r2) 合计 44 (c1) 56(c2) 100(N)问题:甲乙两医生用钼钯X线摄片诊断乳腺癌的可靠性如何?,2、可靠性(reliability),可靠性(信度、重复性或精密度):是指在相同的条件下,重复试验获得相同结果的稳定程度。影响试验可靠性的因素有:(1)受试对象自身的生物学变异(2)观察者的变异:包括观察者间误差和观察者自身误差。(3)试验方法的变异:所使用的仪器、药品和试剂的变异。,诊断试验精确性的评价指标,计量资料:变异系数 CV= SD/M计数资料:符合率、卡帕(Kappa)值 a+d 符合
11、率 = 100% a+b+c+d,Kappa值计算,简化公式 n(a+d)-(r1c1+r2c2) Kappa= n2-(r1c1+r2c2),观察一致率(po)= a+d/n机遇一致率(pc)= (r1 c1)/n+ (r2 c2)/n/n 非机遇一致率=1-pc 实际一致率=po-pc Kappa值=po-pc/1-pc,Kappa值判断标准,Kappa值 一致性强度 0 弱 00.2 轻 0.210.40 尚好 0.410.60 中度 0.610.80 高度 0.811.00 最强,本案例:符合率=76% Kappa =0.53,评价试验的收益,预测值:指真阳(阴)性人数占试验结果阳(阴
12、)性人数的百分比,又称验后概率(PV)。,阴性预测值 d/c+d,阳性预测值 a/a+b,患病率a+c/a+b+c+d(验前概率),预测值的影响因素:特异度、灵敏度、患病率 灵敏度患病率阳性预测值 灵敏度患病率+(1特异度)(1灵敏度) (1患病率)特异度阴性预测值 (1患病率)特异度+患病率 (1灵敏度),本案例:阳性预测值=63.6% 阴性预测值=98.9%,患病率与预测值的关系,患病率:患病率越高,阳性预测值越高,预测值与患病率、灵敏度和特异度的关系,患病率相同时,灵敏度越高,阴性预测值越好; 特异度越高,阳性预测值越好。,案例关联分析,同年,Smith C等人选择317例乳腺触诊有可疑
13、包块且钼钯X线检查异常的女性病例,同样先行FNA检测,随后在同侧乳腺做了手术活检,结果见表2和表3。 表2 FNA检测与手术活检诊断乳腺癌的比较(FNA可疑可判为阳性) 手术活检FNA检测 乳腺癌 非乳腺癌 合计 阳性 113 15 128 阴性 8 181 189 合计 121 196 317 表3 FNA检测与手术活检诊断乳腺癌的比较(FNA可疑可判为阴性) 手术活检FNA检测 乳腺癌 非乳腺癌 合计 阳性 91 0 92 阴性 30 196 226 合计 121 196 317,灵敏度、特异度和患病率不同时乳腺癌诊断结果,摘自(流行病学进展第4卷,施侣元,1986),灵敏度、特异度和患病
14、率不同时糖尿病筛检结果,第三节 试验的指标与标准,试验指标客观指标:最好主观指标半客观指标判断标准:界值,正常人与病人的测量值呈独立分布,评价指标的相互关系及其应用,正常人与病人的测量值呈连续分布,评价指标的相互关系及其应用,正常人与病人的测量值呈交叉分布,评价指标的相互关系及其应用,确定截断值(cut-off value)的原则,1假阳性与假阴性的重要性相等 当出现这种情况时,可选择灵敏度与特异度相等,或使正确指数最大的分界值作为判断标准。 2进一步确诊试验的繁简程度 如果其阳性预测值较低,对试验阳性者必须作进一步确诊。如果确诊试验较繁,费用高,则以提高特异度为主,判断标准右移;否则可考虑以
15、提高灵敏度为主,判断标准左移。,3漏掉一个可能病例的后果 如果该病早期诊断和早期治疗可获得很好的治疗效果,否则后果严重,此时应选择灵敏度高的判定标准,尽可能把所有的可疑病人都诊断出来。如果早期治疗的效果与临床期才开始治疗的效果相近,则应选择特异度高的判断标准,尽量减少假阳性。4一定间隔期后再次检查的可能性 若试验对象在一定间隔期后有机会做第二次检查,则本次漏诊不会造成严重后果,此时应考虑以提高特异度为主,判断标准向右移;否则判断标准向左移。,5该病的患病率 如果某病的患病率低、正常人占绝大多数,此时如果特异度稍有下降,将出现大量的假阳性(误诊)。因此,应以提高特异度为主,判断标准右移。6应考虑
16、治疗的需要 确定诊断标准应考虑治疗的需要,是否能降低病死率及减少并发症 判断标准左移时,灵敏度增加,特异度下降,假阳性增加,将使诊断成本增加。相反,当判断标准右移时,特异度增加,灵敏度下降,假阴性增加,将使漏诊率增加。,确定诊断试验的阈值,均数加减标准差法: 正态分布时 均数2倍标准差百分位数法:偏态分布或分布状态不明时,5%95%为正常。临床判断法ROC曲线法,ROC曲线受试者工作特性曲线,诊断性试验用计量资料表达结果时,将测量值按大小顺序排列,可用任意测量值作为正常与异常的阈值计算敏感度和特异度。ROC曲线能将每个敏感度/假阳性率(1-特异度)对子,用图形表示出来,直观地表示整个敏感度/特
17、异度变动范围及其特征。ROC曲线下面积应在0.51.0之间。0.5:准确性较低0.7:准确性中等0.9:准确性较高对ROC曲线下的面积应作显著性检验。,ROC曲线:确定试验最佳诊断阈值(图中最接近左上方的A点),CPK和EKG诊断心梗ROC曲线比较,假阳性率,真阳性率(灵敏度),比较两种或两种以上试验的价值,CK和EKG诊断心梗ROC曲线比较,假阳性率,真阳性率(灵敏度),比较两种或两种以上试验的价值,第四节 提高试验效率的方法,一、选择患病率高的人群(增加验前概率)二、联合试验并联试验(parallel test):全部筛检试验结果均为阳性者才定为阳性。该法可以提高特异度。 平行串联试验(s
18、erial test):只要有任何一项筛检试验结果为阳性就可定为阳性。该法可以提高灵敏度。 系列,串联试验模式图,并联试验模式图,平行试验:总灵敏度灵(A)灵(B)灵(A)灵(B)总特异度特(A)特(B)系列试验:总灵敏度灵(A)灵(B)总特异度特(A)特(B)特(A)特(B),4.确定诊断试验的阈值,均数加减标准差法: 正态分布时 均数2倍标准差百分位数法:偏态分布或分布状态不明时,5%95%为正常。临床判断法ROC曲线法,案例总结,1.尽管患者无不适主诉,查体也无异常,但由于50岁以上的妇女的乳腺癌的几率为0.3%,为了避免漏诊,医生建议其做乳腺钼钯X线检查,该方法安全、经济、对患者无创伤
19、,同时具有较好的灵敏性,适合对可疑患者进行筛检。2.病史、乳房触诊和钼钯X线检测,只要任一项为阳性(平行实验),则需进一步行FNA检测(即再行系列实验,提高特异度,明确诊断),FNA实验灵敏度为92%、特异度为93%(与前三项平行实验串联后,特异度还会提高)比手术活检经济且创伤小,适宜做诊断实验。该患者FNA检测结果为阳性,提示其患乳腺癌的可能性为64%(由表1分析可知,对于乳腺癌触诊无可疑包块而钼钯X线摄片异常者,其阳性预测值为64%,而对于乳腺触诊有可疑包块而钼钯X线异常者,则阳性预测值升高到88%)。,案例总结,3.鉴于患者患乳腺癌的几率较大(64%),而乳腺癌的早期手术治疗效果较好,于是安排其1周后手术治疗,并在手术的同时做病理切片,病理检测结果最终核实了乳腺癌的诊断。4.假设该患者的钼钯X线检测为异常,而FNA检查为正常,则有99%的把握可排除乳腺癌(由表1分析可知,对于乳腺癌触诊无可以包块而钼钯X线摄片异常者,FNA检测的阴性预测值为99%),即只有1%的可能性是乳腺癌。那么外科手术可考虑暂时不做,建议其定期体检、随访,复查乳腺钼钯X线。当然更为积极的做法是,在患者经济许可且本人同意的前提下,仍行外科手术活检和治疗,因为对于乳腺癌而言,即使是1%的漏诊率也是很高的。,谢谢同学们!,