临床研究中常见的误差及其控制.ppt

资源描述

1、1,临床研究中常见的误差及其控制 (Control the Common Errors in Clinical Research)流行病与卫生统计学黄民主教授,在流行病学研究中，总希望得到科学准确而又真实的结果，但在实际工作中，由于各种因素的影响，使研究结果偏离真实情况，产生误差。因此为了获得真实可靠的临床研究结果，必须在研究的设计、实施及分析的各个阶段充分认识、控制和消除各种误差，使研究结果尽可能与客观真实情况相一致。,3,内容提要,真实性和可靠性选择偏倚信息偏倚混杂偏倚,4,第一节真实性和可靠性,一、概念（一）真实性指研究结果对研究对象的真实情况的反映程度。如果研究结果与客观

2、实际存在差异，这就是误差。误差包括随机误差和系统误差两大类。误差影响着研究结果的真实性和可靠性。,5,真实性包括内部真实性和外部真实性。,内部真实性（internal validity）定义研究结果能真实反映研究人群实际状况的程度。内部真实性是由研究本身的范围所决定的。改善措施限制研究对象的类型和研究条件。,6,外部真实性（external validity）定义研究结果能够被应用到其他人群的程度。也就是结果外推的可靠性。改善措施增加研究对象的异质性，使得研究对象的代表性范围扩大。,7,一项研究首先要具有内部真实性，不具有内部真实性的研究，不可能具有外部真实性，内部真实性是外部真实

3、性的前提。在实际研究时，需要综合平衡考虑研究对象的同质性和异质性问题。,8,（二）可靠性（reliability）定义是反映研究质量的另一个方面，包含两层含义：一是研究结果的可重复性：即不同的研究者，按照相同的研究方法和研究条件，研究结果重现的程度。二是样本含量要具有一定的重复数。,9,要评价一项研究真实性和可靠性的好坏主要反映在研究者对研究中的误差的认识和处理，也就是对研究中出现的随机误差和系统误差的处理和控制。,10,二、误差在流行病学研究中由于：使用方法不同测量结果存在差异使与（即出现误差）各种因素的影响事物的真实情况导致错误结论必须认识、估计和排除各种误差。,

4、11,（一）随机误差定义随机误差是研究过程一类不恒定的、随机变化的误差。可以细分为两类：随机测量误差和抽样误差。由于个体差异的客观存在，抽样研究中抽样误差虽然是不可避免的，但研究发现抽样误差的分布具有一定的规律，可以用统计学的方法对其进行估计和评价。随机误差无固定方向和固定大小，一般呈正态分布。,12,随机测量误差可以采用多次重复测量取平均值的方法进行控制。抽样误差可以采用假设检验和区间估计的方法来处理。传统的假设检验方法用P值大小来估计研究中发生假阳性错误的可能性的大小。区间估计法采用可信区间来显示随机误差的影响。,13,（二）系统误差（偏倚， bias）定义系统误差是在实验过

5、程中产生的，表现为有系统或周期性。不像随机误差一样能随着样本量的增加而减少，而是要通过采用严密的研究设计和严格的技术操作规范加以消除或控制，是另外一种常见的影响研究结果的误差。,14,偏倚产生的原因：1.研究者或研究对象主观原因造成2.由某些未知因素导致3.研究设计的缺陷4.调查方法不适宜5.操作人员的技术水平和责任心不强偏倚可以通过：科学的研究设计合理地选择研究对象等手段减少或控制正确应用调查方法准确收集信息,15,由于临床科研的研究对象主要是人，不可能像动物实验那样做到两组情况基本相同，再加上患者有心理变化、社会环境的差异、失访等情况，都可以影响结果的准确性，因此临床研究更容易

6、产生偏倚。,16,不同类型的流行病学研究方法，可能产生的偏倚各有其特殊的来源和种类，一般分三大类：选择偏倚主要发生在设计阶段信息偏倚主要发生在实施阶段混杂偏倚主要发生在研究设计或资料分析阶段,17,第二节选择偏倚选择偏倚（selection bias）指选入的研究对象与未选入者之间，出现了某些特征上的差异，从而导致研究结果偏离真实情况。研究的设计阶段（主要的）产生于资料收集过程中的失访或者是无应答病因研究常见于临床防治试验,18,常见的选择偏倚:入院率偏倚现患病例新病例偏倚无应答偏倚检出症候偏倚志愿者偏倚排除偏倚时间效应偏倚失访偏倚健康工人效应偏倚,19,1. 入院率偏倚

7、（admission rate bias）又称伯克森偏倚（berksons bias）指在利用医院就诊或者住院病人作为研究对象时，由于入院率不同而导致的系统误差。行业性医院、专科医院只收本行业、本专科病人如疾病严重程度不同，就医条件不同,20,例如，某研究者要研究皮肤癌与高血压的关系。表1 社区人群中皮肤癌、外伤和高血压患病的分布情况表1中可知皮肤癌与高血压之间并无联系（OR=1）。,21,如果以社区某所医院为基础收集病例，假设皮肤癌、外伤入院率分别为60和25，同时伴有高血压者的入院率为40时，从该社区某医院随机抽取皮肤癌患者和外伤患者进行同一研究时，根据不同的住院率计算住院的人数：

8、具体见表2。,22,表2 某医院皮肤癌、外伤及高血压患者的分布情况计算皮肤癌与高血压关联强度的OR值=0.575,高血压是皮肤癌的保护因素(OR1)，为虚假联系。因此，在医院选择研究对象时应防止这种偏倚的产生。,23,2.现患病例-新病例偏倚（prevalence-incidence bias）又称奈曼偏倚（Neyman bias）在研究中选择现患病例为研究对象时，由于他们与新病例在某些特征或者行为上的差异，而造成研究结果的偏倚。在病例对照研究和现况研究中的病例，往往选用现患病例为研究对象，而不包括死亡病例和病程短、轻型、不典型病例，造成现患病例与新病例之间存在差异（即报道的患病率低

9、于实际发病率的差异）。,24,3.无应答偏倚（non-respondent bias）在研究过程中，某些研究对象不按照研究设计的要求对被调查的内容给予回答或不依据研究设计接受治疗、对治疗效果、治疗反应等情况不予回答，由于这部分人群在身体素质、暴露水平、生活习惯、患病情况等方面可能与应答者不同，由此而产生的偏倚。,25,判断无应答是否造成偏倚，可根据无应答者在疾病暴露方面的特征与应答者是否有区别来判断，如果两者有差别，则产生了无应答偏倚。无应答偏倚可在各种研究中产生，尤其是对敏感问题的调查中（如询问性病史）。在研究报告中必须说明应答率，并评价其对结果可能造成的影响。一项研究中应答率应达到9

10、0%以上，如果应答率很低，需作专项调查，查明原因。,26,4.检出征候偏倚（detection signal bias）征候指在疾病和暴露因素之外存在着一个因素，即一种临床症状或体征。该征候不是疾病的危险因素。某因素如能引起或促进某征候的出现，使患者因此而去就医，提高了该病的检出机会，使人误以为某因素与该病有因果联系，这种虚假联系造成的偏倚称检出征候偏倚。,27,如：有人研究子宫内膜癌与服用雌激素有关是虚假联系。雌激素可以刺激子宫内膜生长，使得子宫容易出血，正是如此，服用雌激素者比不服用雌激素者可能由于子宫出血而更加频繁地求医，使处于早期的子宫内膜癌患者容易被发现。因此导致子宫内膜癌患

11、者中口服雌激素的比重被人为的加大，从而得出雌激素与子宫内膜癌有关的虚假关联。,28,在研究设计中为避免检出征候偏倚，应对观察对象进入研究的条件加以限制，使病例组和对照组间主要的非研究因素特征保持一致。,29,5.志愿者偏倚（volunteer bias）这类偏倚常常出现在实验性研究中。一般志愿者与非志愿者在关心实验的程度、配合实验、关心健康程度以及生活习惯等方面均有差别。若将志愿者选作观察对象，而非志愿者落选，这样的研究结果大多存在选择偏倚，这种偏倚称为志愿者偏倚。,30,6.排除偏倚（exclusive bias）在确定研究对象时，没有按对等的原则或标准自观察组或对照组中排除某些研究对象

12、，导致因素与疾病之间联系的错误估计。例如：在研究利血平与乳腺癌关系的病例对照研究中，由于高血压患者倾向于服用利血平降压，若病例组和对照组中高血压患者分布不均时，就会产生这种偏倚。,31,7.时间效应偏倚（time effect bias）许多疾病，如慢性疾病，从接触暴露因素到发病需要很长的时间，在这段时间内实际上这些人有暴露史但没有出现临床症状、体征或未能用现有的检查手段发现疾病的病人，而常被错误的划入健康组或对照组，所产生的系统误差成为时间效应偏倚。例如：一些遗传性疾病未达到外显年龄时，临床表现是正常的，这样的研究对象被纳入健康对照组，常会导致研究结果估计过低。,32,8.失访偏倚在

13、研究过程中，某些最初选定的研究对象因为种种原因脱离了观察，研究者无法继续追踪随访到他们，这种现象叫失访，由此而产生的对研究结果的影响称为失访偏倚。队列研究由于观察人数较多、观察时间较长，失访是很难避免的。在开展队列研究时，要尽量减少失访现象，还可以考虑在设计时增加一定比例的样本量。,33,9.健康工人效应偏倚（health worker effect）健康工人效应偏倚常见于职业流行病学研究。通常受雇佣的工人比一般人群更健康；有些行业还对雇员的健康有专门的要求。在进行相关研究时，可能发现职业暴露人群疾病发生的危险性低于非暴露人群，这种违背常理的结果实际上是因为这些健康工人比一般人群更加健康

14、，且对暴露因素的易感性可能要低于一般人群而产生的，这就是健康工人效应偏倚。,34,选择偏倚的控制1.设计阶段（1）采用严格科学的研究设计设计方案及研究方法的选择。从设计之初就要考虑到各个环节可能出现的偏倚，防止、减少其发生。（2）严格限定纳入与排除的标准有严格、明确的原则与标准。病例入选原则,35,不患所研究的疾病且有暴露研究因素可能对照入选原则不患与研究因素有关的其他病可比：某些特征与病例组可比等2.实施阶段严格按照设计计划要求进行，纳入和排除研究对象的标准在实验组和对照组保持一致，尽量提高应答率。,36,3.分析阶段如无应答率或失访率大于10%，应对无应答者进行随机抽样

15、调查，与应答者进行比较，估计无应答偏倚对结果的影响程度。如果影响程度大，对结论应持慎重态度。在分析过程中，还可采用适当的统计分析方法，对偏倚进行控制。对危险因素的估计还可用多因素进行分析。,37,第三节信息偏倚信息偏倚（information bias）又称观察偏倚（observation bias）。指在研究实施过程中由于收集的有关暴露或疾病的信息不完整、不准确而产生的系统误差。研究对象来自研究者仪器、设备、方法表现是：使研究对象的某种特征被错误分类暴露者错误地认为非暴露者如患者错误地认为非患者,38,常见的信息偏倚回忆偏倚报告偏倚测量偏倚调查者偏倚错分偏倚,39,

16、1.回忆偏倚（recall bias）研究对象对以往发生的事情或者经历回忆不准确或者不完整而造成的系统误差。产生的原因： 1.调查的事情过于久远，研究对象已记忆不清。 2.所调查事件发生频率低或者不太重要，研究对象对此印象不深。 3.研究对象对调查事件不关心。 4.研究对象来源不同时，提供的信息也可能不同 5.有些调查是由调查者亲属代为回答,40,2.报告偏倚（reporting bias）研究对象有意夸大或缩小某些信息而导致的偏倚。常见于敏感问题的调查。 3.测量偏倚（measurement bias）由于研究中所用的仪器、设备、试剂、方法和检验条件的不标准、不统一或者研究指标设计不

17、合理、记录不完整、调查人员的态度不好或水平不高等原因造成研究结果偏离真实值的现象成为测量偏倚。,41,4.调查者偏倚（interviewer bias）由于研究者倾向于发现一些阳性结果，建立或验证某些病因关系。因此，在研究中研究者常常尽可能的去发现或诱导研究对象提供所需要的信息，使得调查结果偏离真实情况而产生的误差。暴露怀疑偏倚都属于调查者偏倚。诊断怀疑偏倚,42,暴露怀疑偏倚（病例对照研究）病例组诱导对产生虚假的结论对照组不诱导诊断怀疑偏倚（队列研究）研究者已知研究对象对研究因素的暴露情况，怀疑已经患了某病，主观上倾向于应出现某种阳性结果，在作诊断分析时，倾向于自己的判断。

18、暴露组细致检查对使研究结果出现偏差非暴露组则不然,43,5.错分偏倚（misclassification bias）在暴露测量或疾病的判断测量中，由于测量标准和诊断标准不统一，使得暴露或疾病状态的判断出现了不同程度的错分而导致的偏倚称为错分偏倚。错分偏倚在病例对照研究或队列研究中都可能发生。既可发生在对疾病的判断中，又可发生在对暴露状态的判断中。,44,错分偏倚如诊断试验或测定仪器、方法都有一定的灵敏度和特异度，两者不可能都是100%，必然会产生一些假阳性（误诊）、假阴性（漏诊）的错误。这样就会将本来是病人诊断为非病人而分入健康对照组；把本来不是病人误诊为病人而分入病例组。这就出

19、现了错分现象。,45,信息偏倚的控制1.研究设计阶段统一的调查表、询问、体检、记录等包括调查员需经过统一的培训等 2.资料收集阶段尽可能采用盲法：使信息偏倚减少到最低限度的重要方法。如双盲：研究者与研究对象对分组情况及有关内容均不知道，可避免报告偏倚和调查者偏倚。,46,根据调查所得的资料获得某种信息的灵敏度和特异度可将含有信息偏倚的资料予以校正。,47,第四节混杂偏倚（一）基本概念混杂偏倚（confounding bias）在流行病学研究中，在评价研究因素和疾病之间关联时，由于一个（多个）潜在的混杂因素的影响，从而歪曲（低估或高估）了研究因素与疾病之间的真正联系，称为混杂偏倚。

20、混杂因素（confounding factor）（混杂因子、外来因素）指与研究因素和研究疾病均有关，如在比较的人群组中分布不均，可掩盖或夸大因素与疾病之间真正联系的因素。,48,（二）混杂因子的判断混杂因素必须具备三个特征： 1.必须与所研究疾病的发生有关，是该疾病的危险因子之一； 2.必须与研究因素有关； 3.不应是研究因素与研究疾病因果链上的中间变量。,49,混杂偏倚的判断是否存在混杂因素及混杂偏倚的方向与程度可通过研究因素与研究疾病的效应估计值（cRR或cOR）及排除掉该因素的可能混杂作用后的效应估计值aRR（f）或aOR（f）予以测量。值的大小反映的是混杂偏倚的大小若值=0，

21、为无混杂； 0，为正值，为正混杂偏倚； 0，为负值，为负混杂偏倚；,50,（三）混杂偏倚的控制1.研究设计阶段（1）限制（restriction）是对纳入的研究对象限制在特定的客观标准范围内，减少彼此间的差异，有利于对观察因素作出正确的结论。（2）匹配（matching）匹配是要求对照组在某些因素或者特性上与病例组保持相同，目的是进行两组比较时排除匹配因素的干扰，是一种限制手段。,51,缺点：同时也失去了对这一因素进行分析的机会，造成信息丢失，低估暴露对疾病的作用。研究因素不能作为匹配条件，否则就不能得到研究因素在比较组的差异，出现这种情况又称为匹配过度（over-matching

22、）。,52,（3）随机化（randomization）：常用于实验性研究指用随机化原则使研究对象以同等的机会被分配到各个处理组中，使潜在的混杂因素和一些主要的非处理因素在各组间分布均衡。简单随机分配随机分配方法分层随机分配,53,1.资料分析阶段（1）分层分析（stratified analysis）将资料按照某个或某些需要控制的因素的不同分类进行分层，然后估计某暴露因素（研究因素）与某疾病之间的关系的一种资料分析方法。,54,（2）多因素分析（multifactorial analysis）要控制的混杂因素多、样本量的限制或者希望研究多种因素（包括研究因素和混杂因素）对疾病的综合作

23、用影响时，分层分析就受到了限制，这时可以考虑应用多因素分析。在多因素分析时，研究因素和混杂因素都同等程度作分析。常用的多元分析方法有：多元协方差 Logistic回归模型 Cox比例风险模型等,55,结束语要保证研究结果真实、可靠，研究者就要正确地认识和估计研究中可能出现的随机误差和系统误差，针对不同的误差采用不同的方法进行识别和控制。在研究设计、实施、分析阶段都要加强对误差的处理，以保证研究的真实性和可靠性。,56,思考题1.什么是偏倚？常见的偏倚有哪几大类？2. 常见的选择偏倚包括哪些？3. 混杂因素应具备的基本特征？4. 混杂偏倚如何判断？如何控制？,57,谢谢！,8年制临床流行病学考试题请根据你所学的临床流行病学课程中临床流行病学研究设计的基本步骤（研究目的和假设、研究设计类型、研究因素、研究对象、测量指标、资料分析方法和统计方法、结果评价、质量控制等），结合你的研究生课题，设计一份设计书（标书）。要求设计书首页写好自己的姓名、年级、专业、学号，并用纸质打印全部的设计书，于2012年3月15日前交班长，由班长于3月15日（星期四）呈送流行病学教研室。流行病学教研室 2012年2月27日,

展开阅读全文