流行病学--病例对照研究.ppt

上传人:h**** 文档编号:151000 上传时间:2018-07-11 格式:PPT 页数:89 大小:658.50KB
下载 相关 举报
流行病学--病例对照研究.ppt_第1页
第1页 / 共89页
流行病学--病例对照研究.ppt_第2页
第2页 / 共89页
流行病学--病例对照研究.ppt_第3页
第3页 / 共89页
流行病学--病例对照研究.ppt_第4页
第4页 / 共89页
流行病学--病例对照研究.ppt_第5页
第5页 / 共89页
点击查看更多>>
资源描述

1、第五章 病例对照研究,Case-control studies,流行病学的任务 病因研究的步骤验证病因假设的方法病例对照研究的原理,引 言,第一节 概 述,概念、目的、特点、用途、种类,一、概念,(一)定义 病例对照研究(Case-control studies)是选择患病和未患病的两组人群,调查这两组人群过去暴露于某个或某些暴露因素的情况及程度,然后比较这两组人群之间暴露的差异,以判断该因素与疾病之间的联系及联系强度的一种观察性研究方法。,调查方向:收集回顾性资料,比较 人数 暴露 疾病,1843年Guy向统计学会报告-最早病例对照研究 分析职业暴露与肺结核发生的关系1844年Louis的著

2、作 最早出现病例对照研究的概念1926年Lane Claypon 报告 生殖因素与乳腺癌关系的研究,(二)研究简史,1947年Schreck和Lenowitz 包皮环切和性卫生与阴茎癌的关系1947年Hartwell 输血与肝炎关系的研究1950年Doll和Hill 吸烟与肺癌的研究,(二)研究简史,20世纪60年代以来,孕妇服用反应停(thalidomide)与婴儿短肢畸形母亲吸烟与先天性畸形早产儿吸入高浓度氧与晶体后纤维组织增生症经期使用月经棉与中毒性休克综合征小剂量电离辐射与白血病母亲早孕期服用雌激素与少女阴道腺癌等之间的关系,(二)研究简史,(三)其他相关概念,1、病例组: 患所研究疾

3、病的人群。2、对照组: 未患有所研究疾病的人群(即健康人,或是患有其他疾病的人)。,(二)其他相关概念,3、暴 露: 指研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。 这些因素、特征或状态即为暴露因素,也叫研究变量。暴露因素可以是机体的特征,也可以是体外的;可以是先天的、人体固有的,也可以是后天获得的。它可以是有害的,也可以是有益的。,(二)其他相关概念,4、危险因素(流行因子、危险因子、泛称为病因): 引起人群发病概率增加的因素。5、保护因素: 引起人群发病概率减少的因素。,二、病例对照研究的主要目的,主要目的是验证病因假设。将人群分为病例组和对照组,调查这两组人群既往暴露于假

4、设因素情况,最后比较病例组和对照组对假设因素的暴露比例。如果病例组与对照组的暴露比例在统计学上无显著性差异,表明该因素与疾病之间无联系。如果病例组与对照组的暴露比例在统计学上有显著性差异,表明该因素与疾病之间有联系。,三、病例对照研究的特点,属于观察性研究方法设立对照观察方向从“果”至“因”研究因素可以有多项不能确证暴露与疾病的因果关系,四、病例对照研究的用途,(一)广泛地探索疾病的可疑危险因素(二)深入检验某个或某几个病因假说(三)为进一步进行前瞻性研究提供明确病因线索,五、病例对照研究的种类,(一)按研究目的分类:1、探索性病例对照研究:它没有预先形成明确的某种假设,而是广泛地搜寻可能的危

5、险因子,以便进一步形成假设供以后检验,它往往是病例对照研究的起步工作。在研究设计上,它不对病例和对照作特别的限制,只需随机抽取一定数量的两类研究人群的样本即可满足需要。一般情况下,对照组人数不得少于病例组。,五、病例对照研究的种类,2、检验性病例对照研究:它提出一个或几个明确的病因假设,通过对比调查,以检验其成立或不成立。它在研究设计上需要对病例或对照组作出较多的规定或限制。,五、病例对照研究的种类,(二)按研究设计的病例与对照配比分类: 1、病例与对照不配比: 在设计所规定的病例和对照人群中,分别抽取一定数量的研究对象。一般对照人数应等于或多于病例人数。此外没有其它任何限制与规定。这种不匹配

6、适合于前述的探索性病例对照研究,实行起来容易,能获得较多的信息。,五、病例对照研究的种类,2、病例与对照匹配 匹配或称配比(matching):即要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰。,五、病例对照研究的种类,1)匹配分类:频数匹配(又称成组匹配):匹配因素所占的比例在对照组与病例组一致个体匹配:给每一个病例选择一个或几个对照,配成对(pair)或配成伍,使对照在某些因素或特征(如年龄、性别等)方面与其相配的病例相同或基本相同。,五、病例对照研究的种类,2)匹配的优点: 匹配提高了研究效率:也就是说增加了分析时的统计学检验能力,或者说是流行病学效率

7、,表现为每一研究对象提供的信息量增加。控制混杂因素的作用:匹配的特征或变量必须是已知的混杂因子,或有充分的理由怀疑为混杂因子,否则不应匹配。匹配比不匹配的结果更清楚易于理解,五、病例对照研究的种类,3)匹配的缺点:增加了选择对照的难度: 一旦某个因子做匹配,不但使它与疾病的关系不能分析,而且使它与其他因子的交互作用也不能充分分析。匹配的因素多,可比性强,控制的混杂因素也多。但容易发生“匹配过度” ,使某些间接联系的因素列入匹配,造成病例组与对照组之间的暴露率差异变小或消失。,五、病例对照研究的种类,3、匹配法注意事项 1)慎重选择匹配因素; 2)可疑病因决不能作为匹配因素 ;3)比例一般为1:

8、1,也可以 1:2,甚至1:3或 1:4,最多不超过1:4 ;4)匹配的因素不宜过多,避免发生“匹配过度(overmatching)” ,增加工作的难度 。,第二节 病例对照研究的步骤,研究内容的确定、研究对象的选择、病例与对照配比、样本含量的确定、暴露因素的确定、混杂因素的确定、调查表格的制定、调查资料的收集、数据资料的整理、数据资料的分析。,一、研究内容的确定,(一)主要研究内容:验证某个(或某些)暴露因素与疾病之间的联系,并估计其联系强度。确定主要研究内容的过程就是提出暴露因素与疾病之间可能存在的因果联系假设的过程。,一、研究内容的确定,(二)提出病因假设方法用描述流行病学方法提出病因假

9、设。根据临床观察的事实提出病因假设。将临床观察与描述流行病学分析结合起来提出病因假设。通过查阅有关疾病的流行病学、临床医学等方面的文献资料提出病因假设。,一、研究内容的确定,(三)暴露因素与疾病之间的联系 无联系 有联系 联系强度大小 虚假联系 因果联系,二、研究对象的选择,(一)病例的选择(二)对照的选择(三)病例与对照配比分类,二、研究对象的选择,(一)病例的选择,(一)病例的选择,1、选择疾病的诊断标准:尽量采用国际或国内通用的统一诊断标准;最好采用对疾病诊断较为特异的诊断标准金标准;自定标准时,注意敏感性与特异性。,(一)病例的选择,2、病例的来源从医院选择病例:为了减少偏倚,病例应尽

10、量选自同一地区多个医院的住院或门诊病例。有简便易行,诊断准确率高,可节省费用,病人易合作等优点。但容易发生选择偏倚。从一般社区人群中选择病例:选择一定期间一定人群中全部病例或者随机样本人群中的全部病例。采用本法收集的病例代表性好,但在实际执行时往往困难较多。病例一般以社区来源为优,代表性较强,但不易得到。,(一)病例的选择,3. 病例种类:最好选择新发病例:其发病时间更接近可疑暴露因素的暴露时间,并且对疾病危险因素的回忆可能比较认真,提供的信息较为准确可靠。也可选择现患病例:有时也可选择现患病例,其优点是在短时间内可收集到足够数量的病例,在研究罕见病病因时常用现患病例为研究对象。 有时可用死亡

11、病例:主要由家属提供信息,准确性较差。但死亡病例省时省钱,很快可以提供研究线索。,(二)对照的选择,形式,(二)对照的选择,1、对照选择的原则:1)候选对象必须来自产生病例的总体2)对照一旦发生所研究的疾病便成为病例组的研究对象,(二)对照的选择,2、对照的来源:从社区一般人群(病例来自该人群)中随机选择对照。较为理想的方法,但实际施行有较多的困难。从医院中患有其他疾病的病人中随机选择对照。应选择多个医院、多科室、多病种的病人作对照。易选,比较合作,但代表性较差。从亲属、邻居、同事、同学等中随机选择对照。代表性也较差,但易选、合作。同时,要考虑到这种对照在某些环境和/或遗传因素方面与病人较为一

12、致。,(二)对照的选择,3、选择对照的要求:对照不患有与所研究的疾病有共同已知病因的疾病。 从医院的其他病人中选择对照时,最好不选择患病时间较长的病人作对照。在医院选择对照时,尽可能包括其他各种疾病的病例。不管选择哪种对照,对照和病例陈述暴露于假设因素的情况要有可比性。,三、病例与对照配比分类:,1、病例与对照不配比:在设计所规定的病例和对照人群中,分别抽取一定量的研究对象,一般对象数目应等于或多于病例人数。此外没有其它任何限制与规定。2、病例与对照配比:即对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰。这些因素或特征称之为匹配因素或匹配变量。,四、样本含量的确

13、定,一方面,为了估计暴露因素与疾病之间的联系强度、检验暴露因素的暴露情况在病例组与对照组之间是否存在差异,必须保证样本数量足够。另一方面,样本数量过多又浪费人、财、物力,影响质量,增加负担。样本数量多少为宜?,(一)影响样本大小的因素:,1、暴露因素在对照组中的估计暴露率(P0);2、估计的该暴露因素引起的比值比优势比(OR);3、所希望达到的检验显著性水平();4、所希望达到的检验把握度(1-)。,(二)估计样本大小的方法:,1、查表法:请参阅其他参考书。2、公式法病例对照研究中配比和不配比的研究所用的计算样本含量公式是不同的。,估计的样本含量并非绝对精确的数值,仅供参考样本量不是越大越好病

14、例组和对照组样本量相等时效率最高,(二)估计样本大小的方法,不配比(即成组)病例对照研究的样本含量公式如下:式中n 为病例组或对照组人数,Z和Z分别为与、值相对应的标准正态分布分位数。P0和P1分别为对照组及病例组估计的某因素暴露率。 q0=1- P0,q1=1- P1近似公式:,五、暴露因素的确定,暴露因素(变量)的选定:一项病例对照研究可用来研究多个暴露因素与疾病之间联系。但研究的暴露因素也不是愈多愈好,所以要精心选择、仔细设计暴露因素。变量的规定:每项变量要有明确的定义,尽可能地采用国际或国内统一的标准,以便交流和比较。变量的测量: 1、定性的指标; 2、定量的指标,六、混杂因素的确定,

15、1.概念 混杂因素亦称混杂因子或外来因素,是指与研究因素和研究疾病均有关,若在比较的人群组中分布不匀,可以歪曲(掩盖或夸大)因素与疾病之间真正联系的因素。2.特点必须是所研究疾病的独立危险因子(危险因子或保护因子);必须与研究因素(暴露因素)有关;一定不是研究因素与研究疾病因果链上的中间变量。,七、调查表格的制定,(一)要求调查表主要根据研究目的、研究内容以及研究设计要求制定。调查表中调查项目要有明确的定义和具体说明,调查表要简单明确,必要的项目一项也不漏掉,不必要的项目一项也不列。制定调查表时,事先周密考虑,最好征求有经验人的意见。为便于用计算机统计分析,现在多用编码方法。,七、调查表格的制

16、定,(二)调查表主要内容:一般情况,如姓名、性别、住址、出生年月、职业等;疾病诊断情况;暴露因素情况;混杂因素情况。,调查表的设计需要多学科专家的参与(流行病学、临床医学、统计学、心理学、社会学) 调查实施前对调查员进行细致而严格的培训编写调查员手册监督与审查 总之,调查员的素质、调查的好坏是取得研究所需要的可靠资料的关键所在,应十分重视。,八、调查资料的收集,(一)资料来源主要包括以下两个方面:1、通过询问调查收集资料。2、通过现成记录收集资料。,(二)收集资料要求,1、要有良好的组织,遵守一定制度和规定,并实行质量监督以保证收集过程顺利和达到高质量。2、使所的收集资料完善、可靠、准确、可比

17、。3、要注意控制信息偏倚,保证收集资料的质量。,九、数据资料的整理,1、原始资料的核查: 对所收集的资料要经过核查、修正、验收、归档等一系列步骤,以保证资料尽可能的完整和高质量。2、原始资料的分组、归纳,或编码输入计算机: 这一步骤是使原始的数据系统化和条理化,在此基础上计算各项指标,描述分布的特征,进一步作分析。,十、数据资料的分析:,主要分析病例与对照组在暴露因素上的差异,分析暴露与疾病的统计学关联强度,确定关联强度的大小比值比又称优势比,交叉乘积比:是指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。,第三节 资料分析,一 、均衡性检验 比较病例组与对照组在研究

18、因素以外的其他主要特征方面有否可比性,两组非研究因素均衡,其暴露率的差异与发病有关。,二 、计算OR值,1、比值比的概念A、比值:指某事件发生的概率(可能性)与不发生概率(可能性)之比。B、病例组的暴露比值:病例组有暴露史的概率与无暴露史的概率之比,即(a/m1)/(c/m1)=a/c。C、对照组的暴露比值:对照组有暴露史的概率与无暴露史的概率之比,即(b/m0)/(d/m0)=b/d。 D、比值比又称优势比,交叉乘积比:是指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。,二 、计算OR值,2、公式 OR:(a/c)/(b/d)=ad/bc,二 、计算OR值,3、O

19、R特点与RR一样,优势比反映暴露者患某种疾病的危险性较无暴露者高的程度 如果能满足以下2个条件 ORRR所研究疾病的发病率(死亡率)很低 病例对照研究中所选择的研究对象代表性好,二 、计算OR值,4、比值比的意义当OR=1时,表示暴露因素与疾病之间无联系。当OR1时,表示暴露因素与疾病之间存在“正”的暴露与疾病联系,暴露因素是一种危险因素,或有害因素。当OR1时,说明存在“负”的暴露与疾病联系,暴露因素是一种保护性因素,或有益因素。,二 、计算OR值,5、计算OR值的步骤1)列四格表,计算两组暴露比值; 2)进行2 检验,判断两组暴露率有无显著性差异所研究的疾病与所研究的因素间有无关联;3)计

20、算OR值及其95%可信限,判断所研究的疾病与所研究的因素间关联强度;4)判断所研究的疾病与所研究的因素的关系。,(一)成组比较法分析,1、列四格表,计算两组暴露比值。,1)病例组的暴露比值:(a/m1)/ (c/m1)=a/c;2)对照组的暴露比值:(b/m2)/ (d/m2)=b/d。,(一)成组比较法分析,2. 2检验 是检验研究因素与疾病之间有否统计学联系?可用传统的四格表公式 也可用antel-Haenszel (M-H)方法 2 0.05(1) =3.84 , 2 0.01(1) =6.63,3. OR计算与可信限的估计及意义,OR 95%CI =,(一)成组比较法分析,常用Miet

21、tinen法的OR可信限计算方法:,OR值的意义:暴露组的疾病危险性为非暴露组的多少倍。,2 ( ad-bc)2n /(a+b)(c+d)(a+c)(b+d)7.70,20.01(1) 6.63,本例2 7.706.63,则p0.01,结论为拒绝无效假设,即两组暴露率差别有统计学意义。,OR ad / bc=(39154)/(24114)2.20,说明口服避孕药者患心肌梗死的危险性是未口服避孕药者的2.20倍。,= 1.26,3.84,(二)1:1配对资料的分析,1、资料整理列四格表:匹配资料是由病例与对照结合成对子,列成下表中的格式,表内的数字a、b、c、d 是病例与对照配成对的对子数。,1

22、:1配对研究中疾病与暴露的关系,2、 检验病例和对照暴露率有无差异,3、计算比值比 OR,4、计算 OR 的可信限,(二)1:1配对资料的分析,OR 95%CI =,食管癌发病因素的研究中发现,吸烟与发病有关,男性的资料归纳成表5-6,2=11.28, OR=4.33表明男性吸烟者患食管癌的危险性是不吸烟者的4.3倍 OR95%可信限,举例:,三、混杂因素作用的估计与分层分析 配比法 分层分析,表57,按饮酒与否分层 计算OR值,饮酒者中吸烟的OR(2.98)稍高于不分层OR(2.87) 不饮酒者中吸烟的OR(1.67)却低得很多表明饮酒是混杂因素,饮酒似可加强吸烟的作用,按饮酒与食管癌的关系

23、列表计算 2=31.9, RR=2.29可见饮酒与食管癌有联系,消除饮酒与否的影响,就要计算这两组人群合并的与OR值,而在此之前必须先作齐性检验(可参照有关书籍)。如果两组人群OR值没有明显差别,用统计学方法消除混杂作用影响,求合并OR值;有显著差异,不宜再计算合并OR值。本例齐性检验的结果无显著差异。,进行齐性检验 齐性检验 合并与OR值 OR值无明显差别,则饮酒是混杂因素 合并OR值 OR值有显著差异,则饮酒是明显混杂? 合并OR值 本例齐性检验无显著差异,计算合并OR与2,计算合并OR与2值 公式(M-H法): 合并 合并,=37.74,=2.42,经饮酒分层调整后,吸烟的2与OR(即合

24、并2与合并OR)虽较未调整的2 (55.5)与OR(2.87)为低,但仍有一定强度与统计学上的显著性。 吸烟与食管癌之间有显著的关联 饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作用,2,M-H,表5-9 分层计算结果整理表,第四节 偏倚及其控制,从研究设计、实施、到数据处理和分析的各个环节中产生的系统误差,以及结果解释、推论中的片面性,导致研究结果与真实值之间出现倾向性的差异,从而错误地描述暴露与疾病之间的联系,称之为偏倚。,定 义,偏 倚,选择偏倚 (selection bias) 信息偏倚 (information bias) 混杂偏倚 (confounding bias),种类,一

25、、选择偏倚,选择偏倚(Selection Bias)指由于入选的研究对象与未入选的研究对象在某些特征上存在差异而引起的误差。这种偏倚常发生在设计阶段。 选择偏倚又可细分为入院率偏倚、现患病例-新发病例偏倚、检出征侯偏倚、时间效应偏倚,1、入院率偏倚(Berkson偏倚),定义 当利用医院病人作为病例和对照时,对照是医院的某一部分病人不是全体目标人群的一个随机样本,病例只是该医院或某些医院的特定病例不是全体病人的随机样本,所以难免产生偏倚,特别是因为各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异。控制 合理地选择病例与对照; 从总体人群中选择所有或绝大多数符合诊断标准的病例; 从各医

26、院中选取病例,从多病种中选择对照。,2、现患病例-新发病例偏倚(奈曼偏倚),定义 如果调查对象选自现患病例,即存活病例,可能得到更多的信息,但是其中很多信息可能只与存活有关,而未必与该病的发病有关,从而高估了某些暴露因素的病因作用;另一种情况是,某病的幸存者改变了生活习惯,从而降低了某个危险因素的水平,或当他们被调查时夸大或缩小了病前生活习惯上的某些特征,导致某一因素与疾病的关联误差。控制 调查时明确规定纳入标准为新发病例,3、检出征侯偏倚(暴露偏倚),定义 病人常因某些与致病无关的症状而就医,从而提高了早期病例的检出率,致使过高地估计了暴露程度而产生的系统误差。控制 延长收集病例的时间,超过

27、由早期向中、晚期发生的时间,4、时间效应偏倚,定义 对于肿瘤、冠心病等慢性疾病,从开始暴露于危险因素到出现病变往往经历一个较长的时间过程,因此那些暴露后即将发生病变的人、已发生早期病变而不能检出的人、或在调查中已有病变但因缺乏早期检测手段而被错误地认为是非病例的人,都可能被选入对照组,由此而产生了结论的误差。控制尽量采用敏感的疾病早期检查技术开展观察期充分长的纵向调查,其他偏倚 无应答偏倚:入选的研究对象与未应答的人员之间有系统的差异,也可致选择偏倚。 研究对象拒绝参加、或除外某些研究对象,会导致暴露与疾病之间联系的估计错误。,二、信息偏倚,信息偏倚(Information Bias)又称测量

28、偏倚、观察偏倚。是在收集信息过程中由于测量暴露与结局的方法(工具)有缺陷,使采集到的信息不准确(即不完全真实),从而引起偏倚。错分是测量不准确导致的最直接的结果。 信息偏倚又可分为回忆偏倚、调查偏倚,1、回忆偏倚,定义由于被调查者记忆失真或不完整造成结论的系统误差原因与调查时间和事件发生的时间间隔、事件的重要性、被调查者的构成以及询问技术有关控制选择不易为人们所忘记的重要指标做调查重视问卷的提问方式和调查技术,2、调查偏倚,来源:调查对象、调查者原因:病例与对照的调查环境与条件不同调查技术、调查质量不高或差错以及仪器设备的问题控制采用客观指征认真做好调查技术培训采取复查等方法做好质量控制检查条

29、件尽量一致使用的检查仪器应精良,三、混杂偏倚,混杂偏倚:研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系特点:不易识别,不易确定,需认真细致地去解决 控制: 匹配法 分层分析法 多因素分析,第五节 优缺点,一、优点,1、 样本量小,病例易获取,工作量不大,所需人力、物力较少,易于进行,出结果快。2、可同时对一种疾病的多种因素进行研究。3、适合于对病因复杂、发病率低、潜伏期长的疾病。4、可以对治疗措施的疗效与副作用做出初步评价。,二、 缺 点,1、易受回忆偏倚的影响2、选择合理的对照较困难3、结果的可靠性不如队列研究4、不能计算暴露与无暴露人群的发病率,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。