1、1,流行病与卫生统计学教研室李硕颀 教授,第四章 诊断试验与筛检试验,本章学习要点,1、掌握诊断试验与筛检试验的基本概念2、掌握评价诊断试验真实性的常用指标及计算方法3、掌握影响诊断试验可靠性的因素4、熟悉诊断和筛检试验评价的设计5、熟悉提高诊断质量的方法,阴性者(即未患该病的人),阳性者(即可能患该病或将来有患病危险的人),患病或具备危险因素,未患病或不具备危险因素,图1 一项普通筛检和诊断试验流程图解,各种诊断试验,筛检试验,外表上健康的人群即健康者和虽患病但尚未诊断者,4,诊断试验定义 应用一定的诊断方法把病人与可疑有病但实际无病的人区别开来。,5,通过快速简便的检验、检查或其它措施,从
2、表面上无病的人群中去发现那些未被识别的病人或有缺陷的人。筛检试验仅是一种初步检查,不是作出诊断。筛检试验阳性者需得到进一步的诊断,确诊后进行治疗。 (美国慢性病委员会 1951年),筛检的定义,6,筛检试验与诊断试验的异同,筛检试验仅作为初步检查,是早期发现病人的一种方法,筛检试验的结果要经过诊断试验加以确诊。 筛检试验主要用于社区人群的健康体检、普查普治或某些特殊意义的研究。诊断试验要求有更高的灵敏度和特异度。筛检试验更侧重评价经济、方便和收益。筛检试验与是诊断试验在方法学和评价指标方面具有相似性。,第二节 诊断试验评价的研究设计,金 标 准,待评价方法,同步盲法比较,判定该方法分辨目标疾病
3、能力,8,评价的主要内容,是否盲法收集试验结果,真实性、可靠性、收益,样本量是否足够,研究对象是否合理,选用适宜的金标准,观察指标和判断标准,9,一、确定金标准 金标准(gold standard) 当前公认最好的、准确可靠的诊断方法(病理学检查、手术探查、特殊影像学检查等),或专家制定并得到公认的临床诊断标准 应用金标准区分有病人群和无病人群,然后用待评价的试验对这两组人群进行测试,并比较分析试验结果。,10,二、研究对象的选择,研究对象选择应采用随机化原则,以确保样本的代表性和试验结果对目标人群的可推论性 病例组应该包括各型病人,典型和不典型、不同病情严重程度、不同病程阶段、有或无并发症的
4、病例。 对照组最好选择需要与研究疾病鉴别的其它疾病,即所选择的对照组与病例组具有许多相似的临床表现,而应慎用自愿者和其他健康人群。,11,三、样本量的估计,样本量可用公式计算或查相应的样本量表获得。在用公式进行计算时,要预先设置诊断试验的灵敏度特异度,显著性水平 以及允许误差。,适用于灵敏度和特异度接近50%时,适用于灵敏度和特异度小于20%或大于80%时,12,四、 观察指标和判断标准的确定,任何诊断试验都要选择适宜的观察指标,指标本身的特性影响诊断试验的结果,通常观察指标有客观指标、主观指标以及介于两者之间的半主观指标。这些指标的不同判断标准或分界值会对诊断试验的结果产生明显的影响,,13
5、,诊断试验的结果是要判断被检查者有病或无病,而在人群中有病和无病的数值常有重叠现象,因此涉及诊断标准的问题。理想的诊断标准应该使误诊率和漏诊率最小。,14,确定诊断标准的方法,统计学方法,临床判断法,ROC曲线法,15,1统计学方法,1)百分位数法: 适用于偏态分布、分布类型不确定或有极端数值的数据。以第95百分位数或第99百分位数的数值做标准 2)正态分布法: 适用于呈正态分布的数据,通常用平均值加减2倍标准差作为标准值。在此范围内的测量值为正常值,两端各2.5%为异常值,16,2临床判断法,按照大量临床观察(如高血压界值)或系列追踪观察某些致病因素对健康损害的阈值(如血清胆固醇)来确定诊断
6、标准。,17,3ROC曲线法,ROC曲线或称为受试者工作特征曲线,是用构图法揭示灵敏度和特异度的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列灵敏度和特异度,再以灵敏度为纵坐标、(1-特异度)为横坐标绘制成曲线,图中对角线下的面积为随机诊断产生的曲线下面积。ROC曲线越向左上偏,曲线下面积越大,诊断准确性越高。,表16:B/E不同取值的灵敏度、特异度、约登指数,*:当B/E值为1.010时,灵敏度为0.932,特异度为0.925,约登指数为0.857(最大),21,五、盲法判定和统计分析、结果报告,要求判断试验结果者预先不知道病例被金标准划分为“有病”或“无病”的情况,可减
7、少人为的主观偏差,保证比较结果的真实性。 全面分析、评价和报告诊断试验的真实性、可靠性和收益。,22,第三节 诊断试验的评价,评价诊断试验的真实性、可靠性以及效益。,23,一、真实性的评价,又称为效度,指一项诊断或筛检试验所获得的数值与实际值的符合程度。 评价真实性的指标有灵敏度、特异度、漏诊率、误诊率和正确诊断指数,表1 应用诊断试验检查某病患者和非患者的结果模式表,试验结果 病 人 非病人 合 计,阳性 真阳性 A 假阳性 B A+B,阴性 假阴性 C 真阴性 D C+D,合 计 A + C B + D A+B+C+D=N,24,1、灵敏度,指一项诊断或筛检方法能将实际有病的人正确地判断为
8、患者的能力。灵敏度= 100% 或 灵敏度=1 假阴性率 灵敏度的标准误 95%SenL,SenU=SenUaSsen,A+C,A,25,2、特异度 一项诊断或筛检方法将实际无病的人正确地 判断为非患者的能力。 特异度= 100% 或 特异度=1假阳性率 特异度的标准误,D,B+D,95%Spe,SpeU=SpeUaSspe,漏诊率:指一项诊断试验将实际有病的人错误诊 断为非病人的比例。也称假阴性率。 漏诊率=1-灵敏度,或,误诊率:指一项诊断试验将实际无病的人错误诊断 为病人的比率。误诊率也称假阳性率。 误诊率=1-特异度 或,27,正确诊断指数(Youden指数),一项诊断方法发现真正的病
9、人和非病人的总能力。 约登指数=(灵敏度+ 特异度 )1 将灵敏度和特异度合并为一个指标,可更全面地评价、比较各种筛检试验的真实性。 指数愈大,反映的真实性也愈大。 约登指数的标准误为,28,3、似然比(likelihood ratio LR),似然比是对诊断试验进行综合评价的重要指标,它综合了灵敏度和特异度的信息,其含义是:在诊断试验中患者出现某种检测结果的概率与非患者出现相应结果的概率之比。 在已知患病率与似然比的情况下,可以利用似然比计算验后比,从而准确地估计单个就诊者的患病概率,以助临床医生的诊断决策。 似然比可分为阳性似然比和阴性似然比。,29,1)阳性似然比(+LR),真阳性率与假
10、阳性率之比,说明正确判断阳性的可能性是错判阳性可能性的倍数。 比值越大,试验结果阳性时为真阳性的概率越大,此诊断方法愈好。 +LR =灵敏度/(1-特异度)=灵敏度/误诊率 或,30,2)阴性似然比 (-LR),是假阴性率与真阴性率之比,表示错判阴性的可能性是正确判断阴性的可能性的倍数,此值越小,试验结果为真阴性的可能性越大,该诊断方法愈好 -LR =(1-灵敏度)/特异度=漏诊率/特异度 即,31,根据似然比判断试验阳性或阴性时患病概率,验前概率:检查前病人患某种疾病的可能性(患病率) 验 前 比:检查前病人患某种疾病的机率。 验 后 比:检查后病人患某种疾病的机率。 验后概率:检查后病人患
11、某种疾病的可能性。 将验前概率转换为验前比 验前比=验前概率/(1验前概率) 通过诊断试验的似然比计算验后比 验后比=验前比似然比(LR) 将验后比转换为验后概率: 验后概率=验后比/(验后比+1),例:某18岁女性因面色苍白、乏力,被怀疑为严重贫血至某医院就诊,根据病史及外周血涂片检查,在该院该年龄段女性患缺铁性贫血的可能性为40%。在实验室进一步做血清铁蛋白检查,结果为12mmol/L,该院血液学实验室以骨髓铁染色作金标准,用血清铁蛋白试验法诊断缺铁性贫血的阈值为65mmol/L,65mmol/L为缺铁性贫血,该方法灵敏度为90%,特异度为85%。问该女患缺铁性贫血的概率是多少? 解: 验
12、前概率 = 0.40 验 前 比 = 0.40/(1-0.40)=0.67 阳性似然比 = Sne/(1-Spe)=0.9/(1-0.85)=6 验 后 比 = 0.676=4.02 验后概率 = 4.02/(1+4.02)=0.80 该病员患缺铁性贫血的概率为80%。,当了解许多症状、体征在某些病的似然比后,可以利用其进行多重试验检验。在进行诊断时,把前一次检验的验后概率作为下一次检验的验前概率,继续运用,直到可下结论为止。举例如下。 一位45岁妇女主诉突发左侧胸痛月余,来门诊就医。该患者是否患冠心病? 查胸痛原因很多,如肺或胸膜疾患;上消化道疾病;冠心病;情绪影响;其他原因。仅只按其主诉,
13、她患冠心病的可能(验前概率)仅为0.01。 验前比=验前概率/(1-验前概率)=0.01/(1-0.01)=0.01。1)进一步询问其疼痛特点,有放射至左臂内侧的特点。其阳性似然比为100, 其验后比=0.01100=1。此时诊断冠心病的概率(验后概率)=验后比/(1验后比)=1/(11)=0.502)再做心电图检查,ST段下降2.2mm,其阳性似然比为11, 验前比=0.5/(1-0.5)=1。验后比=111=11。(0.5为前一项放射痛的验后概率) 验后概率=11/(111)=11/12=0.91673)再检验其血清肌酸磷酸酶(CPK)80单位,此时阳性似然比为7.75。 其验前比=0.9
14、167/(1-0.9167)=11.0048;验后比=11.00487.75=85.25。验后概率=85.25/(185.25)=0.988经过询问症状,心电图检查及血清CPK检查,该病人患冠心病的可能性为98.8,因此可以明确诊断该病人患冠心病。,34,二、诊断试验的可靠性评价,可靠性又称信度,指同一指标在同一受试者身上重复测量时,获得结果的一致性。结果愈恒定,诊断方法的可靠性愈高。,符 合 率,Kappa分析,影响可靠性因素,35,1、符合率(percent agreement):,一项诊断试验正确诊断的病人数与非病人数之和占所有进行诊断人数的比率。符合率越高,可靠性越好,36,2.诊断试
15、验的一致性分析Kappa分析,kappa值为实际一致率与非机遇一致率的比,该值考虑了机遇因素对一致性的影响,表示不同人判断同一批结果,或同一人不同时间判断同一批结果的一致性强度 一般认为Kappa值在0.40.75为中、高度一致,Kappa值0.75为极好的一致性。K0.40时,表明一致性差。,例:临床经验相似的甲乙二医生阅片结果如下: 表1 甲、乙医生阅读胸片诊断结果 甲医生诊断 乙医生诊断 肺门淋巴结核 正常 合 计 肺门淋巴结核 46(a) 10(b) 56(r1) 正 常 12(c) 32(d) 44(r2) 合 计 58(c1) 42(c2) 100(N) 两医生的观察一致率(PO
16、),机遇一致率(PC ) 非机遇一致率 1机遇一致率 100% 51%49% 实际一致率 观察一致率 机遇一致率78%51%27% Kappa值也可直接求取,39,3.影响诊断试验可靠性的因素,1)试验方法与条件的差异 2)观察者的变异 3)被观察者的变异,40,三、收益评价,收益指经诊断试验后能使多少原来未发现的病人得到及时诊断和治疗。以及因此而创造的经济和社会价值。评价收益的常用指标有预测值、成本-效益分析、成本-效果分析等。,41,1预测值,应用诊断试验结果来估计受检者患病可能性大小的指标。是指在已知试验结果的条件下,表明有无疾病的概率。一个诊断方法有一定的灵敏度和特异度,但在诊断患病率
17、不同的人群时,阳性(或阴性)结果所表示的意义却不同,如人群的患病率低,即使应用特异度高的试验也会出现相当多的假阳性。 因此,一项试验要有一个预测值。,阳性预测值试验阳性者真正患该病的可能性 阴性预测值试验阴性者未患该病的可能性,表2: 195例 运动后心电图与冠状动脉造影的比较,冠状动脉造影显示75%狭窄,运动后心电图异常,+ ,合计,+ 55 (a) 7 (b) 62, 49 (c) 84 (d) 133,合计 104 91 195,1. 灵 敏 度 55104100% 52.88% 2特 异 度 8491100% 92.30% 3阳性预测值 5562100% 89% 4阴性预测值 8413
18、3100% 63% 5患 病 率 104195100% 53% 该作者在结论中说:“阳性结果预测男性显著的冠状动脉狭窄时是有用的,但阴性结果并不能用来排除显著的冠状动脉狭窄。”,表3:在患病率低的病人组中运动后心电图与冠状动脉造影的比较 运动后心 冠状动脉造影显示75%狭窄 电图异常 55 (a) 42 (b) 97 49 (c) 478 (d) 527 合 计 104 520 624,合 计,1灵敏度55104100%52.88% 2特异度 8491100% 92.30% 3阳性预测值5597100% 57% 4阴性预测值478527100% 91% 5患病率104624100%17% 当患
19、病率降至17%时,同一试验阳性预测值下降至57%,阴性预测值上升至91%。此时病人运动试验为阳性结果很难预测其有显著的冠状动脉狭窄,但阴性结果则很可能排除显著的冠状动脉狭窄。,预测值还与患病率的高低有关,灵敏度和特异度不变时,该病患病率低则阳性预测值较低,阳性预测值随患病率的增加而上升,故一般认为在患病率较高的人群中开展筛检的意义较大,将会有较高的收益,48,预测值与灵敏度、特异度、患病率的关系,当患病率很低时,即使一个试验的灵敏度和特异度均很高,仍会出现许多假阳性,使阳性预测值降低。,灵敏度和特异度均为99%的试验在不同患病率人群中的阳性预测值,感染 受检 实际感 实 际 未 试验阳 试 验
20、 假 总阳性 阳性预率 人数 染人数 感染人数 性人数 阳性人数 人数 测值(%) (1) (2) (3) (4)=(2)0.99 (5)=(3)(1-0.99) (6)=(4)+(5) (7)=(4)/(6),1/万 100000 10 99990 10 1000 1010 0.99 1 100000 100 99900 99 999 1098 9.021% 100000 1000 99000 990 990 1980 50.00 10% 100000 10000 90000 9900 900 10800 91.67,P64;表4-9,50,2.经济学评价,1)成本效益分析 成本指对一项诊断
21、或筛检试验所花费的全部费用,包括试验所花费的人、财、物力及设备折旧。效益指通过筛检或诊断试验所取得的经济效益。 2)成本效果分析 效果是指通过筛检或诊断实验所取得的社会效益。如延长了寿命,提高了生活质量等 3)成本效应分析 指投入的成本与取得的生命质量改善之间的分析评价方法,51,第四节 提高诊断试验效率的方法,联合试验的多元分析,提高验前概率,系列试验,提高效率的方法,平行试验,其他方法,52,一、平行(并联)试验,同时进行几项试验,只要有一项结果阳性就判为阳性,此种联合提高灵敏度,但特异度可有一定降低。此法可减少漏诊率。在漏诊病人可能导致严重后果时,可采取并联试验。,53,二、系列(串联)
22、试验,用二种以上筛检或诊断试验,只有全部结果均为阳性者才定为阳性,此种联合试验提高了特异度,可以减少误诊率,但却可增加漏诊率。当误诊可造成严重后果时,应采用串联(系列)试验(如 HIV抗体检测ELISA 、明胶凝集试验和各种快速诊断试剂筛查呈阳性反应的需用特异性更强的方法如免疫印迹试验进行确认 )。,例 表4:联合试验筛检糖尿病的结果试 验 结 果 糖尿病人 非糖尿病人尿 糖 血 糖 + - 14 10 - + 33 11 + + 117 21 - - 35 7599 合 计 199 7641,血糖试验: 灵敏度 100%75.38% 特异度 100%99.58% 尿糖试验: 灵敏度 100%
23、65.83% 特异度 100%99.59% 并联试验: 灵敏度 100%82.41% 特异度 100%99.45% 串联试验: 灵敏度 100%58.79% 特异度 100%99.73%,33+117,199,10+7599,7641,14+117,199,11+7599,7641,14+33+117,199,7599,7641,117,199,10+11+7599,7641,56,三、联合试验的多元分析,临床医生可利用多元回归、Logistic回归、判别分析、综合评价(如评分法)等方法对疾病进行综合计量诊断。,57,例:多元判别分析的Bayes概率法,该法是指在患某病的条件下,计算一个病人具
24、有多种症状和体征等出现的概率,依靠这些概率的大小来进行判别和诊断。若以X1,X2, XM表示各种临床表现;A1, A2, AG表示病别,当病人各种症状或体征等的指标值分别为S1, S2, Sm时,属于AG病种的概率如下:,例题:尿路感染的诊断某医院尿路感染检查结果如表5,若某病人X1X6结果分别为。试用Bayes概率法进行定位诊断。 事前概率的计算:肾盂肾炎P(A1)=88/160=55.00% 膀胱炎P(A2)=72/160=45.00%计算P(A1/S1S2S6)的分子,得 A=0.550.70450.50.31820.90910.72730.3409=0.013895 P(A2/S1S2
25、S6)的分子: B=0.450.750.69440.08330.22220.38890.6667=0.001125 P(A1/S1S2S6)=A/(A+B)=0.013895/(0.013895+0.001125) =0.9251=92.51% P(A2/S1S2S6)=B/(A+B)=0.001125/(0.013895+0.001125) =0.0749=7.49%由于P(A1/S1S2S6)大,故诊断为肾盂肾炎,其验后概率为92.51%,即该病人有92.51%的可能性是肾盂肾炎。,表5 160例尿路感染病人定位诊断的资料,临床表现 盂肾炎 (A1) 膀胱炎 (A2),例数 % 例数 %,
26、30万/小时58 65.91 24 33.33,X1(尿频) 有 62 70.45 54 75.00, 无 26 29.55 18 25.00,X2 (尿痛) 有 44 50.00 50 69.44, 无 44 50.00 22 30.56,X3(发热) 有 28 31.82 6 8.33, 无 60 68.18 66 91.67,X4(肾区叩痛) 有 80 90.91 16 22.22, 无 8 9.09 56 77.78,X5(尿白细胞镜检) 10个/HP 24 27.27 44 61.11,10个/HP 64 72.73 28 38.89,X6(白细胞排泄率) 30万/小时30 34.09 48 66.67,