1、1,病例对照研究 Case-control study,流行病学教研室 赵玮,2,本章内容,基本概念研究步骤病例与对照的选择样本含量的估计资料来源与收集方法资料整理与结果分析偏倚及其控制优缺点,3,回 顾,4,一、基本概念,原理示意图,5,一、基本概念,病例对照研究选择一组有研究疾病的病人与一组无此病的对照,调查他们发病前对某个(些)因素的暴露情况,比较两组中暴露率和暴露水平的差异,以研究该疾病与这个(些)因素的关系。,6,暴露研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态,这些因素或状态即为暴露因素,它可以是有害的,也可以是有益的,也叫研究变量。,7,一、基本概念,8,病例对照研
2、究的特点,观察性回顾性的研究;由果推因的研究;设立对照组。,9,二、研究步骤,1.提出研究假设2.制定研究计划3.培训调查员,进行预调查4.实施调查5.资料的整理与分析6.提出研究报告,10,三、病例与对照的选择,病例与对照选择的基本原则代表性 选择的病例要足以代表总体的病例,对照足以代表产生病例的总体人群或源人群可比性 病例组与对照组在年龄、性别等主要特征方面无明显差异,11,病例的选择,来源 医院病例资料(选择不同地区、不同水平、不同种类的医院) 社区人群资料 类型 新发病例 新近发生,回忆准确,首选 现患病例 回忆易受到影响,但数量多 死亡病例 误差大,极少利用 病例的规定 诊断明确,尽
3、量使用金标准 ,统一诊断标准,12,对照的选择,原则候选对象必须来自产生病例的总体。即对照一旦发生所研究的疾病,就能成为病例组的研究对象。来源 可以是同一医院或其他医院诊断为其他疾病的病人(非同一系统病例); 可以是社区人口的非病例或健康的抽样;,13,对照与病例比较的方法,成组比较法按与病例组可比的原则,根据样本的大小,选择一定数量的对照。对照的数量应等于或多于病例。优点:实施容易,丧失信息少缺点:不能控制混杂因素匹配法(matching)个体匹配指给每一个病例选择一个或几个对照,使病例与对照配成对或配成伍,使对照在某些因素或特征(如年龄、性别等)方面与其相配的病例相同或基本相同。匹配的目的
4、是为提高病例组与对照组的可比性,并用于控制某些混杂因素。,14,匹配的注意事项:,慎重选择匹配因素 被研究的因素即可疑病因决不能作为匹配因素 病例与对照的比例一般为1:1,也可以1:2,甚至1:3或1:4,最多不超过1:4 匹配的因素不宜过多,避免发生“匹配过度(overmatching)” 增加工作的难度,15,匹配过度(overmatching):把不必要的项目列入匹配,企图使病例与对照尽量一致,就可能徒然丢失信息,增加工作难度,结果反而降低了研究效率。 一般多只匹配年龄、性别,其他因素须慎重。,16,例,假定夫妻不和睦的男外科大夫有较高的手术事故发生率,如用病例对照研究来检验此假设,合适
5、的对照为A.未出事故的男外科大夫; B.不是外科大夫的男性;C.夫妻和睦的男外科大夫;D.夫妻和睦的不是外科大夫的男性;,A,17,四、样本含量的估计,1.人群中被研究因素的暴露率(exposure rate) 2.比值比 OR或相对危险度RR3.值 4.把握度(1),18,公式法:,19,例,20,例,21,五、资料来源与收集,(一)资料来源 (二)调查的含义及实施时遵循的原则(三)调查表,22,(一)资料来源,医院病案记录,疾病登记报告等摘录 检测病人的标本或病人的环境获得 对病例或对照的询问调查中取得,23,(二)调查的含义及实施时遵循的原则,含义是信息传达、接受和反映的过程,是属于行为
6、科学的范畴 ,被调查者要通过感受、回忆、思维、联想和反映等过程来回答问题。 原则调查表的设计需要各专家参加讨论 调查员要经过严格的培训 调查员手册监督与审查,24,(三)调查表,定义也称“调查问卷”,通过把拟收集的数据项目用恰当的措词构成一系列问题的答卷,是资料收集的最主要工具。内容调查表的名称、编号知情同意书一般项目:姓名、性别、民族等研究项目:研究变量,疾病史、吸烟史等结尾部分:调查员签名、调查日期等,25,26,六、资料整理与结果分析,描述性分析病例与对照研究资料概况和特征进行描述;病例组与对照组的均衡性;推断性分析病例和对照的暴露率和暴露水平;疾病和暴露之间有无联系和联系的强度;这种联
7、系是否由偏倚所致。,27,(一)均衡性检验,检验病例组与对照组在研究因素以外的其他主要特征方面是否有可比性。,28,例,29,1. 检验 是检验研究因素与疾病之间是否有统计学联系。其计算可按传统的四格表的专用公式,也可以用antel-Haenszel (M-H)方法。,(二)成组比较法资料的分析,30,31,2.OR计算与可信区间的估计及其意义,odds ratio,优势比又称比值比、交叉乘积比。指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。OR反映暴露者患某种疾病的危险性较无暴露者高的程度。,32,3.OR可信区间,由于OR值是通过一组样本调查所得的点估计值,存
8、在抽样误差。因此应该估计其可信区间。OR可信区间估计公式为 Z为正态标准差,95%可信区间时为1.96。,33,OR1.0 表明暴露为疾病的保护因素;OR1.0 表明暴露为疾病的危险因素;OR1.0 表明暴露与疾病无关;OR的95%可信区间包含1,表明暴露与疾病之间的联系无统计学意义。,OR的意义,34,例:食管癌发病因素的病例对照研究,检验病例组与对照组两组的暴露率差异是否有统计学意义,结论:两组的暴露率经统计学检验存在差异。,35,结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.183.78之间。,36,(三)1:1配对资料的分析,匹配资料依然用 检验研究暴露
9、因素与疾病之间是否有统计学联系。因为资料是由病例与对照结合成对子,分析结果时不应把对子拆开分析。,37,表内的数字a、b、c、d,既不是病例数,也不是对照数,而是病例与对照配成对的对子数。,38,吸烟与食管癌发病关系的研究,男性的资料归纳成下表。,例,39,结果表明两组的暴露率经统计学检验存在差异,男性吸烟者患食管癌的危险性是不吸烟者的4.33倍,95%的可信范围是在1.8410.18之间。,40,(四)混杂因素作用的估计与分层分析,分层分析的方法识别混杂因素进行齐性检验计算合并OR与 值,研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,
10、掩盖或夸大了所研究的暴露因素与疾病的联系,即混杂偏倚,引起混杂偏倚的因素叫混杂因素。,41,例:在下表资料886例食管癌病人与对照中有586例饮酒 2 =31.9, OR=2.29因此饮酒与食管癌有联系,而生活中饮酒与吸烟关系密切,所以饮酒可能是混杂因素分层分析统计学估计其作用大小,42,1.按饮酒与否进行分层,表 按饮酒与否分层分析食管癌与吸烟的关系,饮酒者中吸烟的OR (2.98)稍高于不分层时OR(2.87) 不饮酒者中吸烟的OR(1.67)较低 表明饮酒是混杂因素,加强吸烟的作用,43,.进行齐性检验,消除饮酒与否的影响,就要计算这两组人群合并的与OR值,而在此之前必须先作齐性检验齐性
11、检验可参照有关书籍两组人群OR值没有明显差别,用统计学方法消除混杂作用影响,求合并OR值,有显著差异,不宜再计算合并OR值本例齐性检验的结果无显著差异,44,3.计算合并OR与2值,合并 合并,45,表7 食管癌与吸烟关系的病例对照整理表,合并,合并,46,提 示 合并2与合并OR较未调整的2 (55.5)与OR(2.87)为低,但吸烟与食管癌之间仍有统计学意义饮酒是吸烟与食管癌之间的混杂因素,能加强吸烟的作用,47,七、偏倚及其控制,1.选择偏倚2.信息偏倚3.混杂偏倚,偏倚:指在研究设计、实施及分析过程中出现的系统误差,它会歪曲暴露与疾病之间的性质或强度,以致出现暴露与疾病之间联系错误的结
12、论。,48,1.选择偏倚由于选入的研究对象与未选入的研究对象某些特征上存在差异而引起的误差。2.信息偏倚在收集整理信息过程中由于测量暴露与结局的方法有缺陷造成的系统误差。 3.混杂偏倚研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系。,49,2.信息偏倚,种类回忆偏倚 调查偏倚,50,回忆偏倚,定义病例对照研究主要是调查研究对象既往的暴露情况,由于被调查者记忆失真或不完整造成结论的系统误差原因与调查时间和事件发生的时间间隔、事件的重要性、被调查者的构成以及询问技术有关控制选择不易为人们所忘记的重要指
13、标做调查重视问卷的提问方式和调查技术,51,调查偏倚,来源调查对象调查者原因病例与对照的调查环境与条件不同,调查技术、调查质量不高或差错以及仪器设备的问题控制采用客观指征认真做好调查技术培训采取复查等方法做好质量控制检查条件尽量一致使用的检查仪器应精良,52,3.混杂偏倚,特点不易识别,不易确定,需认真细致地去解决 控制的方法 匹配法分层分析法 多因素分析,53,八、优缺点,优 点1.简便、快速、省费用、效率高;2.需要调查的对象样本量小;3.同一项调查可识别一个以上的危险因素,以及多个危险因素的交互作用;4.尤其适用于罕见、发病率低、潜伏期长、病因复杂的疾病进行研究;5.适用于研究药物的不良反应,也适用于研究一种新疾病的危险因素。,54,八、优缺点,缺 点易受回忆偏倚的影响选择合理的对照较困难结果的可靠性不如队列研究不能计算暴露与无暴露人群的发病率难以决定暴露与疾病的时间顺序;,55,病例对照研究与队列研究比较,比较项目 病例对照研究 队列研究时间顺序 现在过去 过去现在研究对象 病人和非病人 暴露和非暴露人群样本量 小 大比较内容 暴露情况 疾病情况研究周期 短 长研究费用 低 高暴露测量 偏倚大 偏倚小少见病 适用 不适用计算指标 OR RR AR PARP,