1、疾病诊断试验研究,一、诊断试验研究设计,(一)选择研究对象(二)估计样本含量(三)确定标准诊断方法,(一)选择研究对象,为了保证研究对象具有较强的代表性,选择研究对象应把握以下要点。 1病例组应当包括该病的各种不同临床类型:轻、中、重;早、中、晚期;典型的、非典型的;有、无并发症;治疗过、未治疗过等。 2对照组应选自确实无该病的其他病例,并且应包括易与该病相混淆的其他疾病,一般不能只选正常人做对照。 3病例组、对照组均应是同期进入研究的连续样本或者是按比例抽样样本,而不能由研究者随意选择。,(二)估计样本含量,诊断试验的样本含量取决于对试验灵敏度、特异度、显著性水平和容许误差的要求。 式中n为
2、所需样本含量,u为正态分布中累积概率为/2时的u值,d为容许误差,一般取值范围是0.050.10,p为灵敏度或特异度,一般以灵敏度估计病例组样本量,以特异度估计对照组样本量。,(三)确定标准诊断方法,要建立并评价新诊断方法,就必须与标准诊断方法比较。所谓标准诊断方法也称之为“金标准”。所谓金标准是指当前为临床医学界公认的最客观、最真实、最可靠的疾病诊断标准。常用的金标准。 病理学诊断(组织活检或尸体解剖); 外科手术发现; 特殊的影像诊断(如冠状动脉造影诊断冠心病); 病原学诊断; 临床综合诊断; 长期随访获得的肯定诊断。,二、诊断试验的评价内容与指标,(一)真实性(二)可靠性(三)预测值(四
3、)似然比(五)受试者工作特性曲线,(一)真实性,1定义2评价方法与指标3影响因素,1定义,诊断试验测量值与实际值的符合程度称为真实性(validity)。,2评价方法与指标,要评价一个新的诊断试验,必须选定一个金标准。两种方法同步进行,再将所得数据整理成以下四格表。评价真实性的常用指标包括灵敏度、特异度、误诊率、漏诊率和正确诊断指数等。,例1 以收缩压160mmHg为诊断标准,检查10000人发现阳性病人25人,阴性(160mmHg)病人25人,阳性非病人995人,阴性非病人8955人。试评价其真实性?列四格表如表2所示。,3影响因素,诊断标准:诊断标准降低,使灵敏度升高,特异度下降,误诊率提
4、高,漏诊率下降。反之,诊断标准提高,使灵敏度降低,特异度上升,误诊率降低,漏诊率上升。,联合试验:串联可以提高特异度。并联试验可以提高诊断试验的敏感度。参照标准能正确地区分有病和无病。参照标准选择不当将影响敏感度和特异度,(二)可靠性,1定义2评价方法与指标3影响因素,1定义,诊断试验的可靠性(reliability)又称精确性(precision) 或可重复性(reproducible),是指诊断试验在完全相同条件下,进行重复操作获得相同结果的稳定程度。,2 .评价方法与指标,(1)计量资料的评价方法 采用单因素方差分析,通过计算个体内相关系数(p)评价此类数据的可靠性。一般地说,p0.7,
5、表明数据可靠性较高。,(2)计数资料的评价方法,采用Kappa检验,通过计算Kappa系数可以评价计数资料的可靠性。其参考标准为:k0.40表明可靠性差;0.40k0.6表示数据基本可靠,t0.8表示数据可靠性较好。,3影响因素,(1)所使用的仪器、药品和试剂的变异;(2)调查对象的生物学变异;(3)观察者的测量变异,包括: 不同观察者间的变异(inter-individual variability) 观察者本身的变异(intra-individual variability),(三)预测值,1定义2评价方法与指标3影响因素,1定义,预测值(predictive value) 是指在已知试验
6、结果的条件下,表明有或无该病的概率,又称预告值、诊断价值。 阳性预测值(positive predictive value)指试验阳性者中患该病者的可能性。 阴性预测值(negative predictive value)指试验阴性者中真正为非患者的可能性。,2.评价方法与指标,(1)阳性预测值:指真阳性数占阳性数的百分比。它说明被试人如为阳性时患该病的可能性有多大。 阳性预测值a/(a+b)100% 阳性预测值=患病率灵敏度/患病率灵敏度(1患病率)(1特异度) (2)阴性预测值:指真阴性数占阴性数的百分比。它说明阴性时未患该病的可能性有多大。 阴性预测值d/(b+d)100% 阴性预测值(
7、1-现患病)特异度/(1-现患率)特异度+(1-灵敏度)现患率,3影响因素,(1)灵敏度与特异度 当患病率稳定时,若试验的灵敏度越高,则阴性预测值越高;若试验的特异度越高,则阳性预测值越高。(2)患病率 当灵敏度与特异度稳定时,若患病率越高则阳性预测值越大;若患病率越低阴性预测值越高。,(四)似然比,1定义2评价方法与指标3影响因素,1定义,有病者得出某一试验结果的概率与无病者得出这一概率的比值,称之为似然比(likelihood ratio,LR)。似然比可以全面反映诊断试验的诊断价值。,2评价方法与指标,阳性似然比:指灵敏度与误诊率之比。 阳性似然比灵敏度/误诊率灵敏度/(1特异度) 阳性
8、似然比愈大,提示阳性结果的正确率愈高。阴性似然比:指漏诊率与特异度之比。 阴性似然比漏诊率/特异度(1-灵敏度)/特异度 阴性似然比愈小,提示阴性结果的正确率愈高。,3影响因素,似然比非常稳定,不受诊断试验诊断标准(临界值)变化的影响,亦不受患病率影响。,(五)受试者工作特性曲线,受试者工作特性曲线是以取不同阳性判断标准时的灵敏度为纵坐标,误诊率为横坐标绘制所得的曲线。它表示灵敏度与特异度之间的相互关系。ROC曲线常被用来决定最佳临界点。但仅通过一两次试验,要想找到灵敏度和特异度都好的最佳临界点是不可能的。 若在患病率接近50%时,最接近左上角的那一点,可定为最佳临界点,如图1中的箭号所指处,
9、即灵敏度为80%,特异度为84%处,其误诊率和漏诊率之和最小。 若在患病率极低或很高时,其最佳临界点可不在最接近左上角的那一点。ROC曲线还可以用来比较两种或两种以上诊断试验的诊断价值,从而帮助医生对选择最佳诊断试验。,0 20 40 60 80 100 1 特异度(%),图1 诊断糖尿病中血糖测定的ROC曲线,灵敏度(%),三、诊断指标及其标准的确定方法,(一)诊断指标(二)诊断标准,(一)诊断指标,1客观指标 能用客观仪器测定,很少依赖诊断者及被诊断者的主观意识,如体温、血红蛋白等。2主观指标 完全根据被诊断者的主观感觉,如疼痛、愉快等。3半主观指标 根据诊断者的主观感知判断,如肿物的硬度
10、、中医切脉等。 以上3类指标以客观指标质量最好,以主观指标质量最差,在进行诊断时,应该尽可能选择客观指标。,(二)诊断标准,1确定标准时应遵循的原则 鉴别诊断试验的繁简程度; 漏掉一个可能病例的后果是否严重,早诊断疗效佳取高灵敏度,反之取高特异度; 隔一定间隔期后再一次检查的可能性; 该病的患病率:患病率高时诊断标准要放宽,以减少假阴性;患病率低时诊断标准要严格,以减少假阳性。一旦选定了标准,就必须严格执行,不允许随意更改。,2确定诊断标准的方法,将普通作为正常1)百分位数法:将被测量者的测量数值由小到大排列,并从小到大累积计数次序。若采用双侧检验,则从第2.5百分位数到第97.5百分位数为正
11、常范围;若采用单侧检验,数值过小为异常时则正常下限取第5百分位数,数值过大为异常时则正常上限取第95百分位数。此方法适用于两种类型的数据。数值呈偏态分布;不能确定分布型数据。2)平均值加减标准差法:通常以平均值之上或之下2个标准差作为截断值。在正态分布的数据,平均值2个标准差(2S)包括了95的数据。若资料呈正态分布,则在分布的两侧各有2.5%的人被确定为异常;若资料不呈正态分布,则应对数据作对数转换成正态分布后再估计参考值范围。,异常与疾病相联系,绘制受试者工作特性曲线(receiver operator characteristic,ROC),取其左上角拐弯处之点作截断值。取正确诊断指数(
12、Youdens index)最大时的测量值作为截断值。,按可治疗界值划分,按研究者的意愿规定的数值作为标准或人为决定。如根据在什么标准时进行治疗可以利大于弊。此时既要考虑并发症发生率、病死率,又要考虑费用、效益等。,四、提高诊断质量的方法,提高诊断质量就是提高诊断指标质量、提高诊断方法的质量与可靠性。可从以下几个方面加以考虑。1尽量选用客观指标。2选择正确而合适的指标,对计量指标则应考虑合适的分界值,使其有尽可能高的灵敏度和特异性。3对指标的测量,要把方法及可能影响结果的步骤及条件都进行标化。,4联合试验,并联试验:这是1种同时做几项诊断试验,其中有任何一项阳性,即可诊断为患病。如乳腺癌筛检,
13、可先用触诊检查,再用乳房X线摄片检查,两种方法有一种阳性即可诊断乳腺癌。并联提高了灵敏度,可减少漏诊率,但却增高了误诊率。 联合灵敏度(并联)A灵敏度(1-A灵敏度)B灵敏度 联合特异度(并联)=A特异度B特异度临床工作中遇到以下情况,可以用并联方法。 1)必须迅速作出诊断; 2)目前尚无1种灵敏度很高的试验; 3)灵敏度高的试验费用昂贵且安全性差; 4)漏掉1个病人时后果严重时。,串联试验,这是一种依次进行的几项试验,是否做下一个试验要根据上一个试验结果来决定,在一系列多项试验中,每1次试验均为阳性,最后才判为阳性。如梅毒的诊断,首先有梅毒快速血浆反应素(RPR)试验,然后将所有阳性者再用荧
14、光密螺旋体抗体吸收(FTA-ABS)试验。串联提高了特异度,可以减少误诊率,但却增高了漏诊率。 联合灵敏度(串联)A灵敏度B灵敏度 联合特异度(串联)A特异度(A特异度)B特异度临床工作中遇到以下情况,可以用串联方法。 1)不必迅速作出诊断; 2)目前对该病的几种诊断方法特异度不太高; 3)必须做某些昂贵或不安全的试验; 4)当误诊一例带来许多麻烦或不必要经济损失时。,复合试验,并联、串联诊断指标进行合理组合再用于诊断。根据指标的性质与质量的高低,将指标有串联有并联结合起来应用,以达到较好的结果。比如有三项指标,可定为有两项阳性判断为阳性,或第一项阳性再加上任何一项阳性可判断为阳性,否则诊断为
15、阴性。,5建立专科门诊。6转诊和会诊。7高危人群或有特殊临床表现人群。,五、诊断试验研究的评价标准,是否与金标准进行同步独立盲法比较;研究对象的来源与构成情况是否清楚;样本含量是否足够;对“正常”值的定义是否准确、合理;诊断试验的评价指标是否合适;诊断试验的可靠性高低;作为整组诊断试验的组成部分的试验应检测其贡献率;是否详细介绍具体方法与注意事项;是否进行效用分析与适用性分析。,1. 是否与金标准进行同步独立盲法比较,判断诊断试验真实性的最好方法,是将所考核的诊断试验结果与“真实”情况(“金标准”)进行比较。待评价诊断试验或指标应与金标准同步盲法(独立)测量与判断。阅读诊断研究文献时,首先要检
16、查文章的作者是否对每一位被研究对象在进行所考核的诊断试验时,都采用了合适的金标准,并独立判定结果。,2. 研究对象的来源与构成情况是否清楚,研究对象来自哪类哪级医院,其验前概率(患病率)差别很大,从而影响试验结果对疾病的预测值。病例组是否包括该病的各种不同临床类型病人(轻、中、重;早、中、晚期;典型的、非典型的;有、无并发症;治疗过、未治疗过等)。对照组是否包括了确实无该病的其他病例,并且应包括易与该病相混淆的其他疾病病人。,3.样本含量是否足够,除按公式计算外,根据经验与大家默认的要求,每组样本应不少于30例。,4.对“正常”值的定义是否准确、合理,对“正常值”的定义直接影响诊断试验的敏感度
17、、特异度等指标和新诊断实验本身的真实性及其应用价值,正常值和诊断阈值的确定是否合理和可靠。,5.诊断试验的评价指标是否合适,诊断试验的评价指标应采用真实性(灵敏度、特异度、误诊率、漏诊率、正确诊断指数)、似然比(阳性、阴性似然比)、预测值(阳性、阴性预测值)及ROC曲线等。是否仅简单计算两组的集中趋势及其变异系数或率及其标准误,并进行相应的t检验或2 检验。,6.诊断试验的可靠性高低,是否严格控制试验条件和观察者变异范围,并详细报道。可靠性评价是否根据数据类型分别采用个体内相关系数、Kappa系数、Kendall相关系数等指标。,7.作为整组诊断试验的组成部分的试验应检测其贡献率,如果是复合诊断试验,是否每一个试验的敏感度和特异度等重要指标都进行了测量,对联合试验研究中每一个单独的诊断试验进行全面评价,才能准确判断联合试验的真实性,并为读者提供了解及应用这些试验的客观依据。,8.是否详细介绍具体方法与注意事项,新的诊断试验能被迅速普及应用才能产生社会效益,使更多的病人得到及时正确诊断和治疗,因此,是否详细介绍诊断试验的操作步骤、仪器设备、试剂、试验条件、注意事项等,利于他人重复或应用。,9.是否进行效用分析与适用性分析,诊断试验的实用价值是否予以描述,是否对新的诊断试验有效性、有无不良反应、可能带来的社会经济效益、安全性、病人能否接受等作出实事求是的评价。,