1、临床研究中常见偏倚及其控制,提纲,一、概述二、选择偏倚及其控制三、信息偏倚及其控制四、混杂偏倚及其控制,误差(error)定义: 指对事物某一特征的度量值偏离真实值的部分,即测量值与真实值之差分类: 随机误差(random error) 系统误差(systematic error),即偏倚(bias),一、概述,举例:用血压计测量某人血压(实际值为85mmHg),各次测量的均值为90mmHg。下图为系统误差和随机误差的示意图,真值(动脉内导管),血压计测定值,随机误差定义: 指由于个体差异和在研究过程中许多微小的不可控制因素造成的误差(测量误差和个体差异)特点:不可避免具有规律性,一般呈正态分
2、布重复是控制和缩小随机误差的主要方法,偏倚(系统误差) 定义: 指在流行病学研究的设计、实施或资料分析阶段发生的一种误差,特点: 研究结果系统的偏离真实情况,具有方向性 研究过程中应加以控制甚至消除分类: 选择偏倚、信息偏倚、混杂偏倚,研究偏倚的意义,临床流行病学研究中少不得“中庸之道”,即不偏不倚。偏倚可发生在研究设计、实施、分析以至推论的各个阶段。加大样本量并不能使之减少。只有深入研究,才能了解、认识各类偏倚,以便在研究过程中尽量加以避免或控制,从而保证研究结果的真实性。,二、选择偏倚及其控制,(一)选择偏倚概念(二)选择偏倚产生环节与原因(三)常见选择偏倚(四)选择偏倚的控制,(一)选择
3、偏倚概念,选择偏倚:是指所选择的研究对象(样本)与所研究的目标人群之间在某些特征方面存在的系统误差。本质:是研究对象缺乏代表性。常见于病例对照研究、临床试验和横断面调查。,(二)选择偏倚产生环节与原因,产生环节:主要发生于研究设计阶段(抽样未严格遵循随机化原则),亦可发生于资料收集阶段(无应答,失访过多)。产生原因:被选入对象同落选对象间在与研究有关的特征方面有系统差别。,(三)常见选择偏倚,1.入院率偏倚(Berkson偏倚)2.检出征候偏倚(detection signal bias)3.现患-新病例偏倚(Neyman偏倚)4.易感性偏倚(susceptibility bias)5.排除偏
4、倚(exclusive bias),1.入院率偏倚(Berkson bias),1)概念:指利用医院就诊病人作为研究对象时,由于入院率不同而导致的偏差。2)本质:入院率不同暴露率变化联系强度变化3)原因: (1)不同医院的技术专长; (2)患者疾病的严重程度; (3)患者的经济状况; (4)就诊的方便程度等。4)常发生此偏倚的研究设计类型:病例对照研究,尤其是以医院为基础的病例对照研究。,表1 呼吸道疾病与骨骼运动器官疾病的关系(一般人群),表1 呼吸道疾病与骨骼运动器官疾病的关系(住院6个月以上病人),2.检出症候偏倚,1)概念:指某因素与某病在病因学上虽无关联,但由于该因素的存在而引起该疾
5、病症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群较高的检出率,以至得出该因素与该疾病相关联的错误结论。 2)本质:病例发现机会(时间)不同联系强度变化 3)原因: 某因素如果能引起或促进某症候的出现,使患者因此去就医,这就提高了该病的检出机会。 4)常发生此偏倚的研究设计类型: 在对肿瘤、动脉硬化、结石等慢性病采用病例对照研究进行病因学研究时容易发生。,实例:口服雌激素与子宫内膜癌病例对照研究,病例组:子宫内膜癌患者,对照:无子宫内膜癌患者;结果:子宫内膜癌患者口腹雌激素比例高;结论:口服雌激素是子宫内膜癌的危险因素。,偏倚:无症状早期子宫内膜癌病人服雌激素后易致出血就诊。服雌
6、激素人群比一般人群该病的检出率高。,3.现患-新病例偏倚(Neyman偏倚),1)概念:指采用现患病例作为研究对象时由于现患病例与总体病例对某因素的暴露率不同而导致的系统误差。以称存活偏倚或患病率发病率偏倚。2)本质:暴露率不同联系强度变化3)原因: (1)病死率高,病程短的严重致死性疾病,如心梗; (2)病程短许多患者已痊愈; (3)轻型不典型病例; 4)常发生此偏倚的研究设计类型:病例对照研究。,实例:大量饮用咖啡与心梗关系的病例对照研究,病例组:医院心梗病人;对照组:医院非心梗病人;结果:大量饮用咖啡与心梗无关偏倚:调查对象为存活者,只是一般饮用咖啡或减少饮用量,入院前死亡病人多是大量饮
7、用咖啡者。,4.易感性偏倚,当某项研究的对象过于集中在某一类人群,而该人群的暴露与疾病的易感性有关,从而导致暴露与疾病之间的虚假联系。如以油漆生产车间工人为对象,研究该种油漆与皮肤过敏间的关系,可能会发现这一人群过敏性皮炎的发生率并不比其它人群高。但是,这里面可能存在因自然淘汰而影响研究结果的情况,即能够留下来在该车间工作者可能多是对油漆刺激不易感者。,5.排除偏倚,指研究中“无应答”、失访或“不依从”者较多,研究者采用简单地将该部分人资料剔除的办法,仅用余下对象的结果进行分析而带来的偏倚。因为被排除对象与余下的对象可能存在某些影响研究结果的明显差异。,人群调查表返回:男性回答率90以上;女性
8、回答率50,且多数为女性吸烟者未回答。结果:低估女性吸烟率。,实例:调查吸烟在男女人群中的比例,(四)选择偏倚的控制,1控制选择偏倚的基本方法1)研究者对整个研究过程可能出现的各种选择偏倚应有充分的了解、掌握 即在选择研究对象、研究方法等过程中是否存在产生选择偏倚的原因?是什么原因?在设计时应周密考虑,并采取针对性措施在相应的环节降低其产生的可能性,以减少或避免其产生。2)严格掌握研究对象的纳入与排除标准,随机化 采用或制定明确、统一与公认的诊断标准,尽可能选择各级医院的早期病人为研究对象。,3)采取措施提高应答率 研究中尽量取得研究对象的合作,以获得尽可能高的应答率,减少失访与退出。 (1)
9、做好组织工作,加强对患者及其家属宣传研究工作的意义,以提高依从性; (2)建立健全随访管理制度,随访要有专人负责,对失访者要及时采取措施以保证随访; (3)回答患者来信的要求,不失信于患者;改进随访信格式与内容,删除使患者及其家属反感的措辞,采用关心体贴的言语。 (4)调查手段要简便易行,对调查内容中的敏感问题采取适当的处理技巧。,4)尽量在一般人群中选择研究对象 能够代表源人群,2在应用具体研究方法是控制选择偏倚的主要针对性措施,1)在横断面调查时,采用随机抽样,并保证一定的样本含量,以增强样本的代表性,必要时可采用分层随机抽样的方法,尽量提高应答率。2)在病例对照研究中,最好用人群中全部新
10、发病或新发病的随机样本;对照应能代表产生病例的人群。若难以做到,则在多个医院选择病例,同时选择医院与社区对照,并尽可能选用新病例,不用死亡病例和老弱对象。,3)在队列研究中,尽量减少失访和失访率。4)在流行病学现场实验中,随机抽样选择研究对象,并进行随机分组。5)在诊断、疗效与预后研究中,尽可能扩大选择病例的范围,如多中心临床研究,并包括主要特征的各类各种病人。,三、信息偏倚,(一)信息偏倚概念(二)信息偏倚产生环节与原因(三)常见信息偏倚(四)信息偏倚的控制,(一)信息偏倚概念,信息偏倚:指由于测量、诊断、询问或抄录过程中收集资料不当,使观察对象的某些特征被错误分类而产生的误差。本质:测量(
11、暴露、疾病、预后等)时发生错误分类。,(二)信息偏倚产生环节与原因,产生环节:信息偏倚主要发生在资料收集阶段,亦可发生于研究设计与资料整理分析阶段。产生原因:资料的观察、测量、收集方法不当,诊断试验的分类错误以及患者提供有关信息的准确性不足,并且这种不足在比较组之间存在差别。,(三)常见信息偏倚,1.回忆偏倚(recall bias)2.诊断怀疑偏倚(diagnostic suspicion bias)3.暴露怀疑偏倚(exposure suspicion bias)4.测量偏倚(measurement bias) 5.报告偏倚(reporting bias),1.回忆偏倚(recall bi
12、as),1)概念:回忆偏倚是指研究对象在回忆以往发生的事情或经历时,由于在准确性和完整性上的差异所致的系统误差。在病例对照研究中最常见。 2)产生原因:(1)所调查事件或因素发生频率太低,未给研究对象留下深刻印象而被遗忘;(2)所需回忆事件时间久远,研究对象对其已记忆不清;关于自然流产史回忆准确性研究发现,对前10年发生的自然流产,82%回忆准确;前20年发生的自然流产,仅73%能回忆完整。(3)研究对象对所调查的内容或事件关心程度不同,而致回忆的认真程度不一。,实例:幼儿白血病病因学的病例对照研究,Slewart等(1956)在关于幼儿白血病病因学的病例对照研究中发现,多数患儿母亲于本次怀孕
13、期间和孕前接受X线的比例大于对照组,以腹部和骨盆接受X线检查尤为明显,认为幼儿白血病与母亲孕期接受X线照射有关。,有学者认为,两组妇女孕期X线照射史不同也有可能由于回忆偏差所致。因为,由于幼儿患病或死亡给病例组母亲在心理上带来创伤,使他们能够比较认真地回忆孕期各方面的情况,甚至家属也帮助回忆;而对照组母亲无此创伤,可能不会认真回忆,使暴露率较病例组低,从而夸大了X线照射与幼儿白血病之间的联系。有学者比较了孕妇接受X线照射的医院记录与其回忆结果,发现两者一致率仅73%。,2.诊断怀疑偏倚(diagnostic suspicion bias),1)概念:研究者若事先知道研究对象的某种暴露或预后因素
14、,就怀疑其已具有某种结局,或在主观上倾向于应出现某结局,于是在作诊断或分析时,倾向于自己的判断,此即诊断怀疑偏倚。2)例如,对暴露组或实验组进行非常细微的检查,而对非暴露组或对照组则不然,从而使研究结果出现偏差。3)常见于队列研究和临床试验,特别是在诊断亚临床病例、判断药物副反应时,这种偏倚最容易产生。,3.暴露怀疑偏倚(exposure suspicion bias),如研究某因素与一种疾病的关系时,研究者从主观上认为两者有联系并希望出现阳性结果,在收集基本情况或随访信息时,会在下意识中充分挖掘病例组的暴露信息而忽略对照组的暴露信息。暴露怀疑偏倚往往会夸大研究因素与研究结果间的联系,造成正偏
15、。,4.测量偏倚(measurement bias),1)测量环境与条件不对等(1)病例在医院调查,对照在家里或工作场所调查;(2)病例与对照使用不同的调查表;(3)调查者对病例与对照的态度与认真程度不同;(4)由不同调查员调查病例与对照;(5)调查病例与对照的时间间隔太长;(6)调查员无意或有意地套取符合病因假说的信息。,2)测量差错(1)调查员未按要求进行培训与预调查;(2)使用的仪器设备不精良或未按要求校正;(3)使用的试剂药品不规范;(4)调查表设计不科学,记录不完整;(5)调查询问方式、态度不恰当;(6)调查或研究工作丧失科学态度。,5.报告偏倚(reporting bias),报告
16、偏倚是指研究对象有意地夸大或缩小某些信息而导致的偏倚。亦称说谎偏倚。例如,调查性乱史或青少年吸烟史等,就可能会有相当部分的被调查者没有如实地报告实际情况。对从业人员进行健康调查时,某些人为了继续从事该职业可能故意缩小某些患病信息。,(四)信息偏倚控制,1制定明细的资料收集方法和严格的质量控制方法 (1)测量变量与指标明确、客观,并力求量化或等级化; (2)研究中使用的仪器、设备应精良,并经常校正,使用标准化试剂; (3)对资料收集者进行统一培训,以便统一标准、统一方法,并按要求进行预调查,调查方法也应规范化,调查者对被调查者的询问方式,提问的深度和广度均应相同;,2.尽可能采用客观指标或客观方
17、法获取信息。 如应用实验室检查结果、诊疗记录作为资料的来源。此外,可以采用虚变量来分散研究对象的注意力,以减少主观因素对信息准确性的影响。制定严格统一的诊断标准与纳入标准,并严格执行。3.尽可能采用“盲法”收集资料采用“盲法”收集资料有助于减少观察员的测量偏倚,若做不到盲法,应由同一个观察员测量待比较的各组。,4. 尽量在同一时间由同一调查员调查病例与对照。5. 研究者应始终以科学的态度搞好研究工作的质量控制。,四、混杂偏倚,(一)混杂偏倚概念(二)混杂因子的特征(三)混杂因子的识别(四)混杂偏倚的控制,(一) 混杂偏倚概念,1.定义:混杂偏倚(confounding)是指在研究某暴露因素与疾
18、病(事件)之间的关联时,由于一个或多个外来因素的影响,掩盖或夸大了所研究暴露因素与疾病(事件)的联系。引起混杂偏倚的因素称为混杂因子(confounder)。2.混杂偏倚在分析性研究、实验性研究中均可发生,但在分析性研究中尤为多见,并可发生于研究工作的各个阶段。,(二)混杂因素的特征,1. 是所研究的疾病的危险因素2. 与所研究的暴露因素有联系3. 混杂因素应不是疾病因果链中的中间变量。,研究肺癌与饮酒关系时吸烟混杂作用分析示意图,1.根据专业知识和经验提出可疑的混杂因子。2.分层分析再比较粗OR与层内OR是否相等。当粗OR值层内OR值时,混杂因子的作用是正的,称之为正混杂,反之,为负混杂。3
19、.借助计算机进行多元分析,(三)混杂因子识别,粗OR,层内OR,与研究结局相关,与研究因素相关,(五)混杂偏倚控制,研究工作中可在三个阶段采取不同措施控制混杂偏倚。即在研究设计阶段采取预防措施防止混杂因子发挥作用;在资料收集阶段详细准确收集潜在混杂因子的资料;在资料分析阶段采取各种技术措施控制混杂偏倚的产生。,1.研究设计阶段的控制,1)限制:限制研究对象的选择条件,使某些可能产生混杂作用的变量不进入研究。如比较4550岁组妇女口服避孕药与乳腺癌发病的关系,就是通过限制年龄范围来控制其混杂作用。2)匹配:匹配是指应用一种特殊性限制方法,强制实验组与对照组在某些混杂因素上保持同质性,以期在设计阶
20、段控制混杂因子。,3)随机化方法(随机分组),(1)随机分组是指每个研究对象都有同样的机会进入治疗组或对照组;(2)检验随机化效果的方法是比较两组的基本特征;(3)随机化是消除混杂偏倚的有效方法平衡治疗组与对照组已知可能影响疗效和预后的因素;平衡我们不清楚地因素。,2.资料收集阶段,认真收集关于混杂因素的详尽材料。,3.在资料分析阶段,1)分层分析 常用Mantel-Haenszel方法。例如在研究吸烟与冠心病关系时,采用病例对照研究,年龄、性别可能是混杂因素,可采用年龄大于或小于60岁分层分别比较,也可采用男女性别分层比较。,2)标准化 当两个率进行比较时,如果两组内部构成存在差别足以影响结
21、论,需要标准化或校正。 例如比较冠状动脉手术死亡率时,甲医院:48/1200=4%;乙医院:64/2400=2.6%。,3)多变量分析(Logistic回归模型、COX模型等)用途:病因、危险因素、预后因素研究;优点:平衡多个混杂因素,且可以是连续变量;估计混杂因素的相互作用;减少样本量;决定危险因素或预后因素的相对比重;,一、二、三次文献PICO文献阅读的基本步骤:泛,精,笔记医学论文撰写时必须遵循以下几个基本原则论文撰写时题目的要求临床科研方法学-研究设计、测量和评价临床科研设计的三要素临床试验设计的四原则,随机化的目的主要是为了在选取样本和将研究对象分组时,防止来自研究者与被研究者两个方面的主观因素的干扰,避免结果偏离真实值。 主要避免选择偏倚对照目的是消除非处理因素的干扰盲法的目的是为了克服可能来自研究者或受试者的主观因素所导致的偏倚。导致研究结果的失真实性。主要避免信息偏倚重复的目的是降低抽样误差,显示研究总体真实的客观规律性,Thank you !,