章病例对照研究.ppt

上传人:h**** 文档编号:262420 上传时间:2018-08-01 格式:PPT 页数:102 大小:2.16MB
下载 相关 举报
章病例对照研究.ppt_第1页
第1页 / 共102页
章病例对照研究.ppt_第2页
第2页 / 共102页
章病例对照研究.ppt_第3页
第3页 / 共102页
章病例对照研究.ppt_第4页
第4页 / 共102页
章病例对照研究.ppt_第5页
第5页 / 共102页
点击查看更多>>
资源描述

1、1,病例对照研究Case Control Study,刘丽流行病与卫生统计学系,目的与要求,掌握病例与对照的选择;掌握非匹配或成组匹配设计资料的分析、个体匹配资料的分析;掌握上述两种资料OR值的计算及OR值的意义。 熟悉病例对照研究基本概念、基本特点;熟悉病例对照研究分层、分级资料分析;熟悉病例对照研究的优缺点。了解病例对照研究的目的、研究类型、实施步骤、样本含量的估计、研究应注意的问题;了解资料的多因素分析、病例对照研究的偏倚及控制。,2,检验假设,验证假设,第一节 基本原理,病例对照研究的概念 选择患有某病和未患有某特定疾病的人群,分别作为病例组和对照组,调查并比较两组研究对象既往某些因素

2、的暴露情况,判断该暴露因素是否与该病有关联及关联程度大小的一种观察性研究方法。从疾病出发,去探讨可能的病因 回顾性研究 (Retrospective study),暴露 (exposure) 指研究对象接触过某种待研究的物质(如重金属、X线)、具备某种待研究的特征(如年龄、性别及基因突变等)或行为(如吸烟)。暴露因素或研究因素,5,6,危险因素(risk factor)引起某特定不良结局发生或使其概率增加的因素。保护因素(protective factor)导致疾病事件降低的暴露因素称为保护因素,决定因素/研究因素,暴露即是具有该研究因素,以确诊患某种特定疾病的病人作为病例组以不患该病但具有可

3、比性的个体作为对照组通过询问、实验室检查或复查病史,搜集既往危险因素暴露史测量并比较两组各因素的暴露比例,经统计学检验该因素与疾病之间是否存在统计学关联;利用病因推断技术,对统计学上的关联进行分析。,基本原理,a,c,b,d,a/(a+c),b/(b+d),人数,比较,病例对照研究特点,观察法按照是否患病分组,设立对照(分析性方法)测量的是暴露情况,而非疾病情况回顾性,由果 因研究一般不能验证病因,1843年Guy向统计学会报告-最早病例对照研究 分析职业暴露与肺结核发生的关系1844年Louis的著作 最早出现病例对照研究的概念1926年Lane Claypon 报告 生殖因素与乳腺癌关系的

4、研究(符合现代病例对照研究的概念),研究简史,1947年Schreck和Lenowitz 包皮环切和性卫生与阴茎癌的关系1947年Hartwell 输血与肝炎关系的研究1950年Doll和Hill 吸烟与肺癌的研究,20世纪60年代以来,孕妇服用沙利度胺(thalidomide,反应停)与婴儿短肢畸形母亲吸烟与先天性畸形早产儿吸入高浓度氧与晶体后纤维组织增生症经期使用月经棉与中毒性休克综合征小剂量电离辐射与白血病母亲早孕期服用雌激素与少女阴道腺癌等之间的关系,应用,广泛探索疾病的可疑危险因素深入检验病因假说为进一步前瞻性研究提供依据治疗方法或药物有害作用的研究疾病预后因素的研究诊断试验的评价、

5、防治措施效果的评价,第二节 研究类型,病例与对照不匹配 病例与对照匹配 衍生的研究类型,按设计类型分,病例与对照不匹配,从设计所规定病例和对照人群中,分别 抽取一定量的研究对象 对照组人数病例组人数 对照组应能代表产生病例的人群 此外没有其他限制与规定。,病例与对照匹配,匹配/配比(matching)要求 对照在某些因素或特征上与病例保持一致目的 对两组进行比较时排除匹配因素的干扰 分类频数匹配 frequency matching个体匹配 individual matching,频数匹配(又称成组匹配) 匹配因素所占的比例在对照组与病例组一致整体的匹配。个体匹配 以病例和对照个体为单位进行匹

6、配。 1:1匹配,又称配对;1:2, 1:3, 1:41:R 匹配。匹配因素的一致程度: 离散变量,完全匹配; 连续变量,在一定范畴内匹配(分组或分类),匹配法注意事项 慎重选择匹配因素(已知混杂因素或有理由怀疑为混杂因素!) 可疑病因不作为匹配因素 比例一般为1:1,最多不超过1:4 避免匹配过度(overmatching),匹配的目的 提高研究效率 控制混杂因素的作用,对照/病例比例与研究效率的关系,个体匹配时,以M为对照的个数,研究效率=M/(M+1)。M越大,效率越高。但比例数与效率的提高不成比例。,匹配过度(overmatching) 把不必要的项目进行匹配,企图使病例和对照尽量一致

7、,可能导致信息丢失,增加工作难度,反而降低研究效率。不应进行匹配的情况(非混杂因素)疾病因果链上的中间变量;只与暴露因素有关,与疾病无关的因素;可能是疾病的某一危险因素。,衍生的研究类型,巢式病例对照研究 病例病例研究 病例时间对照设计,病例对照与队列研究作为病因研究的主要方法,有其各自的优势与不足,而且这些优势与不足相互补充,因此,在实践过程中产生了一些新的研究类型,结合使用这两种方法,扬长避短。,病例队列研究病例交叉设计,巢式病例对照研究(nested case-control study) 基本原理 按队列研究方式进行 选择一队列,收集基线资料,采集所研究的生物学标志的组织或体液标本储存

8、备用随 访 随访到出现能满足病例对照研究样本量的病例数为止,匹配 按病例进入队列的时间、疾病出现时间与性别、年龄等匹配条件,从同一队列选择1个或数个非病例作对照,抽取病例与对照的基线资料并检测收集的标本资料处理 按匹配病例对照研究方法处理资料,1992年Ross用巢式病例对照研究: 上海地区肝癌与尿中黄曲霉素生物学标志关系 18244名中年男性队列中发现22例肝癌 每例配4个对照 检测研究开始时的尿样: 发现黄曲霉素B1及其代谢产物和DNA加成物的OR值经 调整混杂因素后,为3.8(1.212.2)。 黄曲霉素作为肝癌致病因素最直接的证据,病例队列研究(case-cohort study)基本

9、原理 研究开始时,在队列中随机选取一组样本作为对照组观察结束时,队列中出现被研究疾病所有病例作病例组与随机对照组进行比较 这种研究模式,可同时研究几种疾病,不同疾病有不同病例组,但对照组都是同一组随机样本,病例队列与巢式病例对照研究的区别对照是随机选取,不与病例进行匹配随机对照组中成员如发生被研究疾病,既为对照,又同时为病例1个随机对照组可以同时和几个病例组比较分析,病例队列与巢式病例对照研究的优点 因果关系清楚 资料可靠 论证强度高 省时省力省钱 适合于分子流行病学研究,背 景 1994年Piegorseh、Begs等提出 遗传与环境的关系 交互作用 病例对照研究和队列研究的效率费用,病例病

10、例研究(case-case study)也称单纯病例研究,应用前提条件 在正常人群中基因型与环境暴露各自独立发生,所研究疾病为罕见病(此时可用OR来估计RR值),基本原理,研究示意图,单纯病例研究,环境暴露,基因型,病人,+,-,+,-,+,-,OR=ad/bc当ORge1时, 有正相乘模型交互作用当ORge=1时, 无相乘模型交互作用当ORge1时, 有负相乘模型交互作用,E+,E-,G-,G+,b,a,d,c,表5-1 环境暴露与基因型,解决问题 1991年美国Maclure提出病例交叉设计 日常生活中一些突发事件之后,常会伴随某些结果的发生。究竟是这些突发事件导致了结果的发生,还是仅仅由

11、于机会所致?,病例交叉研究(case-crossover design),暴露与某急性事件有关 比较相同研究对象暴露情况 在急性事件发生前一段时间与未发生事件的某段时间,基本原理,如果暴露与少见的事件(或疾病)有关,那么刚好在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露频率。,研究对象 病例和对照,两部分的信息均来自于同一个体 病例部分“ 危险期,疾病或事件发生前的一段时间 “对照部分” 对照期,危险期外特定的一段时间 研究是对个体危险期和对照期内的暴露信息进行比较,第三节 研究设计与实施,确定研究假设确定研究类型研究对象的选择样本量估计资料收集偏倚的识别与控制资料整理和分析,研究步

12、骤 提出假设 根据以往疾病分布的记录或现况调查得到的结果,结合文献资料,提出病因假设,明确适宜的研究类型 选择病例与对照比较的方法: 形式: 非匹配、频数匹配、个体匹配 原则:广泛探索病因,采用不匹配或频数匹配罕见病采用个体匹配1:R的匹配法,R值不宜超过4防止匹配过度,病例与对照的来源与选择基本原则: 代表性 病例能代表总体的病例 对照能代表产生病例的总体人群或源人群 可比性(往往更重要) 病例组与对照组在年龄、性别等主要特征上无明显差异来源:以医院为基础 hospital-based以社区为基础 community-based,病例的选择判断病人的标准/如何获得符合标准的病人?选择病例的要

13、求诊断可靠 使用金标准病例类型:新发病例、现患病例、死亡病例选择确诊的新病例,回忆偏倚小代表性好容易合作 被调查因素改变少,来 源 医院住院或门诊的病例,代表性好工作开展比较困难耗费人力物力,社区的病例(最优),比较合作 资料易得到且比较可靠与对照的可比性好代表性差,对照的选择对照的选择是整个研究的关键之一;研究结论是否可靠,首先要看对照的选择是否合理。原 则 1. 未患此病的人(可以是其它疾病); 2. 足以代表产生病例的总体(代表性); 3. 除研究因素外其它条件一致(可比性); 4. 必须具有暴露于研究因素的可能性; 5. 根据需要确定配比数(对照形式)。,来 源 社区基础的健康人或非该

14、病人(最接近全人群的无偏样本) 医院来源的其他病例(使用最多) 配偶、亲属、邻居、同事、同学等社会团体人群的非该病病人或健康人,医院为基础的对照选择注意事项:对照所患疾病与病例的病因无关选择多个病种的病人组成从新发病人中选取对照不选择当前患有多种疾病的病人,病例对照研究社区为基础/医院为基础,样本含量的估计影响样本大小的因素人群中被研究因素的暴露率(对照组中的暴露率)暴露与疾病关联强度指标OR的估计值(查阅文献或预调查获得)值 把握度1-根据以上有关参数查表或代入公式计算,方 法查表法公式法: 不匹配(病例组与对照组人数相等),病例组暴露率,对照组暴露率,P1=P0OR/(1+P0OR-P0)

15、,P1=P0OR/(1+P0OR-P0),P1=P0OR/(1+P0(OR-1),例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。 某市普通人群中吸烟率 P0=20% OR=2.0 =0.05 把握度0.90 问需要多少病例与对照?,、值查表,Z为1.96, Z为1.282代入公式得:病例组与对照组,各需232人。,病例组与对照组例数不等时的公式:病例数:对照数=1:c对照组例数为c*n,1:1匹配设计总对子数 p0和p1分别代表目标人群中对照组与病例组 的估计暴露率 m为暴露状况不一致的对子数,4. 1:R配比样本量估计先计算病例数n,进而求得对照数为rn,估计样本量注意事项:选择适

16、当的样本量样本量一定时,病例组和对照组样本含量相等时,效率最高。,研究因素的选定与测量 根据研究的目的或具体的目标,确定调查变量的数目和每一个变量的具体项目。每项变量都要有明确的定义。研究中应尽可能地采用定量或半定量的量度。,吸烟与肺癌的关系的研究吸烟的定义:吸烟与否;开始吸烟的年龄、吸烟的年限、每天吸烟量、是否戒烟、戒烟的时间;是否被动吸烟(被动吸烟的定义);三手烟?,资料来源与收集方法 资料的收集在病例对照研究中十分重要方式方法不恰当,收集的资料就不可靠,存在统计处理无法纠正的系统误差 准确、完整、可比、可靠资料来源 医院病案记录疾病登记报告等摘录致病因素数据需检 测病人的标本或环境获得询

17、问调查获得,调查表,内容调查表的名称、编号一般项目:姓名、性别、民族等研究项目:研究变量,疾病史、吸烟史等结尾部分:调查员签名、调查日期等,调查实施时遵循的原则调查表的设计需要各专家参加讨论调查员要经过严格的培训调查员手册监督与审查,第四节 资料的整理与分析,资料整理,描述性统计统计性推断不匹配资料的分析1:1配对资料的分析混杂因素作用的估计与分层分析,资料整理,核查原始资料(查漏补缺纠错)原始资料的分组、归纳、或编码输入计算机 双人平行录入,描述性分析:研究对象的一般特征描述: 病例组和对照组样本量,人口学特征构成,目的是分析研究对象的代表性;频数匹配时还应描述匹配因素的频数比例。均衡性检验

18、 比较病例组和对照组某些基本特征是否相似或齐同,检验病例组和对照组的可比性。 如有统计学差异的因素,应分析其是否对其他因素产生影响。,目的:分析研究因素是否与疾病关联?内容:检验研究因素与疾病之间是否存在统计学关联;评价关联强度/研究因素的效应大小;分析偏倚对结果的影响。 不同设计类型的病例对照研究资料分析形式有所不同。,统计性推断,2检验 检验研究因素与疾病之间有否统计学联系?,非匹配病例对照资料的分析,统计性推断,P1, 说明疾病的危险度因暴露而增加;OR1, 说明疾病的危险度因暴露而减少。 前提条件所研究疾病的发病率(死亡率)很低病例对照研究中所选择的研究对象代表性好,则OR值就很接近甚

19、至等于RR值,OR的置信区间(confidence interval, CI)1)Woolf自然对数转换法:以OR方差为基础Var(lnOR)=1/a+1/b+1/c+1/dlnOR 95% CI=lnOR1.96OR 95% CI=exp(lnOR 95%CI)2) Miettnen卡方值法置信区间不包括1,即可认为该OR在0.05的水平上有统计学意义。,结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.183.78之间,匹配资料是由病例与对照结合成对子,分析结果时不应把对子拆开分析。 先将资料列成表5-4的格式 注意表内的数字a、b、c、d是病例与对照配成对的对

20、子数,1:1配对资料的分析,2=(|b-c|-1)2/(b+c)2=11.28, OR=4.33表明男性吸烟者患食管癌的危险性是不吸烟者的4.3倍 OR 95%CI=,H0:吸烟与食管癌无统计学关联H1:吸烟与食管癌有统计学关联,分级暴露资料分析,分析暴露与疾病的剂量反应关系根据暴露因素的分级将资料归纳成列联表对列联表数据进行卡方检验计算出各暴露水平的OR卡方趋势检验,男性每日吸烟的支数与肺癌关系,卡方检验(RC):2=43.15, =3, P0.001说明吸烟量按吸烟水平分级后,组间差别有统计学意义。各暴露分级的OR:以不吸烟为参照组。OR1=8.10, OR2=11.52, OR3=17.

21、93OR随吸烟剂量的增加而递增。卡方趋势检验: 2=40.01, =1,P0.001剂量反应趋势具有统计学意义,说明吸烟与男性肺癌之间存在剂量-反应关系。,卡方趋势检验,非个体匹配分层资料,分层分析是按照某种特征(如年龄、性别等)把研究人群分为不同的层次(层),然后分别分析各层中暴露与疾病的关联。可评价分层因素本身作用及其与暴露之间关系评价分层因素与暴露因素在疾病中的交互作用既可以识别混杂因素,也可以控制混杂,同时提高检验效率。可帮助正确设计多因素模型分层太多,层中例数会出现“0”,导致丢失效率 食管癌与吸烟的研究时,考虑饮酒为混杂因素,则按是否饮酒进行分层分析。 吸烟 食管癌 饮酒,按饮酒与

22、否分层 计算OR值,饮酒者中吸烟的OR(2.98)稍高于不分层OR(2.87) 不饮酒者中吸烟的OR(1.67)却低得很多,吸烟与食管癌的关系列表计算 2=56.6 P0.05, OR=2.87,在非病例中判断吸烟与饮酒的关系2=37.3, P0.01吸烟与饮酒存在统计学关联,在资料中886例食管癌病人与对照中有586例饮酒.在非暴露组中判断饮酒与食管癌的关系 2 =31.9, OR=2.29 因此饮酒与食管癌有联系,且饮酒与吸烟密切相关,表明饮酒是混杂因素,饮酒可能加强吸烟的作用。 消除饮酒的影响,就要计算这两组人群合并的与OR值,而在此之前必须先作齐性检验。,进行齐性检验 (层别效应的一致

23、性假设与检验) 齐性检验 合并与OR值OR值无明显差别,则饮酒是混杂因素 合并OR值OR值有显著差异,则饮酒与吸烟存在交互 合并OR值本例齐性检验无显著差异( 2 =3.38),计算合并OR与2,计算合并OR与2值 公式(M-H法):,=37.74,=2.42,经饮酒分层调整后,吸烟的2与OR(即合并2与合并OR)虽较未调整的2 (56.6)与OR(2.87)为低,但仍有一定强度与统计学上的显著性。 吸烟与食管癌之间有显著的关联。 饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作用,2,MH,表5-8 分层计算结果整理表,分层分析的过程总结,病例对照研究中偏倚的种类 偏倚的控制,第五节 常见

24、偏倚及其控制,选择偏倚(selection bias)选入的研究对象与未选入的研究对象在某些特征上存在差异而引起的误差(选择的研究对象不能代表总体人群)。常发生在研究的设计阶段。最常见偏倚 入院率偏倚,又称伯克森偏倚(Berksons bias) 选择医院的病人作为病例与对照,这些病人可以因为种种原因造成入院率的差异。例如高血压、肿瘤、阑尾炎病人的入院率显然各不相同入院率的不同就可造成偏倚。,病例对照研究中常见偏倚的种类,选择偏倚的控制尽量合理地选择病例与对照尽可能地从多家(类)医院选择病例与对照,信息偏倚(information bias)在研究的实施阶段从研究对象获取所需数据时产生的系统误

25、差。其发生可能来自与收集数据有关的所有人和物,包括研究对象、研究者本身、测量仪器、设备、方法等。,回忆偏倚 病例对照研究是回顾性调查,难避免回忆偏倚。倾向性 被调查者与调查员均可能有倾向性,盲法可以克服,匹配研究方法的偏倚匹配过度 将一些被研究因素或因果链的中间变量,或将一些不必匹配的因素作为匹配因素而造成匹配过度的影响 可使研究得不出结果 真实的结果被歪曲了 浪费不少工作量匹配因素 明确的或有充分理由怀疑的混杂因素 匹配因素不宜过多 不可将研究因素匹配,混杂偏倚(confounding bias)定义:在评价暴露因素与疾病之间的关联时,由于一个或多个既与暴露因素有关,同时由于研究疾病有关的外

26、来因素存在,使得暴露因素的效应和外来因素的效应混在一起,从而歪曲了暴露因素与疾病的关联性。此外来因素即为混杂因素。基本特征:混杂因素必须与所研究疾病有关混杂因素必须与所研究因素有关混杂因素不是研究因素与研究疾病因果链上的中间环节。,流行病学研究中,发现统计学意义上的联系,在进行病因学推论前,必须首先排除潜在混杂因素的作用,估计和调整混杂偏倚的影响。混杂偏倚类型:正混杂偏倚:夸大暴露与疾病的关联负混杂偏倚:减弱暴露与疾病的关联。,混杂因素作用的估计与分层分析限制(设计阶段)随机化分组(实验流行病学)配比法 (设计阶段)分层分析 (资料分析阶段)多因素分析(资料分析阶段),第六节 研究实例,研究背

27、景 研究方法 研究结果,研究背景,美国波士顿Vincent纪念医院妇产科医生Herbst发现 19661969年收治7例阴道腺癌患者7例在1522岁之间7例均为腺癌阴道腺癌应为中老年女性的疾病 阴道癌占女性生殖系统癌的2% 阴道腺癌仅占阴道癌的5%10%,非常罕见,Herbst对阴道腺癌危险因素进行探索 7例患者加上另一个医院例患者作为病例组 每个病人配4个对照,共32个对照 调查员用调查表对病例和对照的母亲进行了 调查,经统计学处理后的主要结果见表5-9,研究方法,研究结果,研究结果,在比较的因素中,只有三个因素有显著差别母亲怀孕期间使用过己烯雌酚激素治疗 (P0.00001)母亲以前流产史

28、(P0.01)此次怀孕阴道出血史(P0.05)因有后两个因素存在才使用己烯雌酚治疗做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中的女儿以后发生阴道腺癌的危险性增加,病例对照研究的优点队列研究的优点病例对照研究的局限性队列研究的局限性,病例对照研究与队列研究优点与局限性的比较,第七节 优点与局限性及实施时应注意的问题,病例对照研究的优点特别适用于少见病、罕见病的研究省力、省钱、省时间,并易于组织实施还可用于疫苗免疫学效果考核及暴发调查等可同时研究多个因素与某种疾病的联系对研究对象多无损害,队列研究的优点 研究者亲自观察资料,信息可靠,回忆偏倚小 直接计算RR和AR等,反映疾病危险关联的指标

29、可证实病因联系 有助于了解人群疾病的自然史 分析一因与多种疾病的关系 样本量大,结果比较稳定,病例对照研究的局限性不适于研究暴露比例很低的因素选择偏倚难以避免暴露与疾病时间先后难以判断,信息真实性差存在回忆偏倚不能测定暴露和非暴露组疾病的率,队列研究的局限性 不适于发病率很低的疾病病因研究 依从性差,易出现失访偏倚 耗费人力、物力、财力和时间,组织与 后勤工作亦相当艰巨 研究设计要求更严密,实施病例对照研究应注意的问题,假设目的是否清楚? 疾病与暴露变量的定义明确? 病例与对照的来源,诊断方法? 新发病例还是现患病例? 排除标准是否明确?,抽样的方法与样本大小的估计是否恰当? 调查表是否经过试用? 调查表的真实性与可靠性是否经过评估? 资料整理、统计方法及分析内容是否明确? 如何控制或调整偏倚? 结论的真实性如何?,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。