流行病学队列研究.ppt

上传人:h**** 文档编号:150833 上传时间:2018-07-11 格式:PPT 页数:110 大小:713KB
下载 相关 举报
流行病学队列研究.ppt_第1页
第1页 / 共110页
流行病学队列研究.ppt_第2页
第2页 / 共110页
流行病学队列研究.ppt_第3页
第3页 / 共110页
流行病学队列研究.ppt_第4页
第4页 / 共110页
流行病学队列研究.ppt_第5页
第5页 / 共110页
点击查看更多>>
资源描述

1、第六章 队列研究,Cohort Study,引言,队列“Cohort” 原意是指古罗马军团中的一个分队。流行病学家加以借用,表示有共同经历或共同状态的一群人,例如一组出生队列有相同的出生年代,一组吸烟队列有共同的吸烟经历。,病因和危险因素研究是流行病学研究的重要任务,病因研究的逻辑顺序应该是先有病因存在,然后有疾病发生。因 果,引 言,第一节 队列研究的概述,概念特点用途类型应用条件,一、队列研究的定义,队列研究(Cohort Study)是将某一人群分为暴露及未暴露于某因素的两种人群,追踪其各自的发病(或死亡)结局,比较两者发病(或死亡)结局的差异,从而判定暴露因素与发病有无因果关联及关联大

2、小的一种观察性研究方法。,二、其他有关概念,1、队列:表示有共同经历或共同状态的一群人。1)出生队列:指特定时期内出生并按此出生时期确定的一组人群。2)通常队列或暴露队列:泛指有共同特征的或暴露于某事物及因素的一组人群。,二、 其他有关概念,2、暴露:是指研究对象直接接触过的某物质,或食用某种食物或具备的某特征或行为。3、暴露组:暴露于某研究因素的研究对象。4、非暴露组:未暴露于该研究因素的研究对象。,二、 其他有关概念,5、队列人群:1)固定队列:是指人群都在某一固定时间或一个短时间之内进入队列,并对他们观察随访,直至观察期终止,成员没有因为结局事件以外的其它原因退出,也不再加入新成员,即在

3、观察期内保持队列的相对固定。 2)动态队列:即根据某时期确定队列后,可以随时增加新的观察对象。,固定队列 Fixed Cohort,研究开始,研究结束,出现结局,未出现结局,动态队列 Dynamic Cohort,研究开始,研究结束,出现结局,失访,二、 其他有关概念,6、自然实验:是指观察人群自然暴露于可疑因素的队列研究。但是其本质是观察性研究,而不是实验研究。,在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记各组人群待研究的预期

4、结局的发生情况(如疾病、死亡、或其它健康状况),比较各组结局的发生率,从而评价和检验危险因素与结局的关系。,基本原理,N,目标人群,代表性样本,Y,E,时间顺序,暴露,结局,Y,N,三、队列研究的特点:,(一)属于观察性研究(二)研究对象按暴露与否分组(三)在时间顺序上是由前向后的 (四)由“因”及“果”,四、队列研究的用途,1、检验病因假设2、研究疾病的自然史3、评价预防效果,前瞻性队列研究(prospective cohort study) 历史性队列研究(historical cohort study)双向性队列研究(ambispective cohort study),五、队列研究的类

5、型,队列研究的类型,(一)前瞻性队列研究,1、定义:研究对象的确定与分组是根据研究开始时的状态,研究的结局需随访观察一段时间才能得到。这种设计是队列研究的基本形式。,2、优点:可以直接获取第一手资料,偏性比较小;从因到果研究,可信性强;可计算发病率。3、缺点:观察样本量大,费用高,观察时间很长,这些都会影响其可行性。,(一)前瞻性队列研究,选择前瞻性队列研究应考虑的因素,应有明确的检验假设,检验的因素必须找准。所研究疾病的发病率或死亡率较高,如不低于5.应明确规定暴露因素,并且应有把握获得观察人群的暴露资料。应明确规定结局变量,并且有确定结局的可靠手段。应有把握获得足够的观察人群,明确暴露与非

6、暴露组。大部分观察人群应能长期随访下去,并取得完整的可靠资料。,(二)历史性队列研究,1、定义:研究对象的确定和分组是根据历史上记载的暴露情况而作出的,研究的结局在研究开始时已经从历史资料中获得。尽管搜集暴露与结局资料的方法是回顾性的,但究其性质而言仍属前瞻性观察,仍是从因到果的。,(二)历史性队列研究,研究开始时,暴露与疾病均已发生先追溯历史资料,研究暴露和非暴露组,然后通过各种途径查出研究对象的发病和死亡情况历史资料的完整性和真实性将影响到研究的可行性和结果可靠性缺乏混杂因素的资料,可能歪曲研究结果,(二)历史性队列研究,2、优点:节省时间、人力和物力,出结果快。因而适宜长诱导期和长潜伏期

7、的疾病,也经常用于具有特殊暴露的职业人群的研究。3、缺点:常常缺乏影响暴露与疾病关系的混杂因素的资料,以至影响暴露组与未暴露组的可比性。因资料积累时未受到研究者的控制,所以内容上未必符合要求。,(三)双向性队列研究(混合型队列研究),1、定义:历史性队列研究之后,继续进行前瞻性队列研究。,2、特点:这种研究具有上述两种研究的优点,在一定程度上弥补了它们的不足。3、应用:最适宜评价对人体健康具有短时间效应和长期作用的暴露因素的研究。,(三)双向性队列研究(混合型队列研究),六、应用条件,有明确的检验假设所研究疾病的发生率较高(5)明确规定暴露因素和结局变量可靠的测量手段足够的观察人群和暴露情况能

8、完成随访的人群足够的人、财、物力,第二节 队列研究设计与实施,暴露因素的确定、研究现场的确定、研究对象的确定、样本含量的确定、观察结局的确定、混杂因素的确定、调查表格的制定、调查人员的培训、基线资料的收集、随访资料的收集。,一、暴露因素的确定:,(一)通常是在病例对照研究或现况研究的基础上确定的暴露因素,目的是为了进一步验证暴露因素与疾病之间的因果联系。(二)必须有明确的定性或定量的规定。(三)暴露水平可分级别。(四)有收集方法:如,通过问卷方法、医学检查、有关记录、环境检测等。,二 、研究现场的确定,有足够符合条件的研究对象领导重视群众支持医疗条件较好交通较便利发病率较高,三、研究对象的确定

9、,1、研究人群:必须是未患研究结局疾病的人群,而且在追踪观察期有可能发生所研究结局疾病。2、分组:1)暴露组暴露于研究因素的研究对象2)非暴露组未暴露于研究因素或最低水平暴露于研究因素的研究对象。,(一)暴露组的选择,1、一般人群2、职业人群3、特殊暴露人群4、有组织的人群团体,1、一般人群,在某地一般人群中选择暴露组。 其研究结果具有代表性 但观察费用较高,在追踪观察中易发生失访。,2、职业人群:,从暴露于研究因素的职业人群选择的暴露组。优点:职业人群往往暴露于令人感兴趣的假设因素, 有固定职业不易发生失访,一般具有完整的健康记录,可从中获得对研究有用的资料,可结合定期体检进行追踪观察。 如

10、:研究联苯胺的致癌作用,可选择染料厂工人; 研究石棉致肺癌的作用,可选择石棉作业工人等。,3、特殊暴露人群:,指对某因素有高的暴露水平的人群。常常首选。选择特殊暴露人群,包括职业人群做暴露时,常用历史性队列研究,因对暴露的危害作用多半不是一开始就认识到的,一旦认识到了,大多都采取了防护措施以减少暴露,所以不易进行前瞻性队列研究。,4、有组织的人群团体:,从有详细可靠的健康和疾病记录的参加医疗和人寿保险者等有组织的人群团体选择暴露组。主要目的是利用他们的组织系统,便于有效地收集随访资料。而且他们的职业和经历往往是相同的,可增加其可比性。 如Doll和Hill选择英国医师会员以研究吸烟与肺癌。,(

11、二)非暴露组的选择,内对照外对照一般人群对照多重对照,1、内对照,在同一研究人群中,采用没有暴露或暴露水平最低的人员作为对照即为内对照。队列研究应尽量选用内对照,因为这是最理想的对照,除暴露因素外,它与暴露人群的可比性好,同时选用内对照较方便可行。,2、外对照,当暴露组选自特殊暴露人群或职业人群时,有时难以找到合适内对照,需要在该人群之外寻找对照组,可从同一地区一般人群中或同一地区无该因素的职业人群选择对照组。,3、一般人群对照(总人口对照):,使用暴露人群所在地区的人口,而且时间上也是一致或相近的,以保证可比性。1)发病率或死亡率比较稳定且容易得到。2)可以节省大量的经费和时间。3)资料比较

12、粗糙,往往不十分精确或缺乏要比较的项目。,4、多重对照,或叫多种对照,是同时用上述两种或两种以上的形式选择多组人群做对照。,四、样本含量的确定,在队列研究开始以前,要确定足够的样本数量,以保证在规定的显著性水平和把握度水平上,检出暴露组与非暴露组的发病率差异,确定暴露因素与疾病之间是否存在因果关系。,(一)估计样本含量时的几个问题:,抽样方法:与其它研究相同。暴露组与对照组的比例:一般来说对照组的样本含量不宜少于暴露组的样本含量,通常采取两组等量的方法。估计失访率:通常按10%估计失访率,故按计算出来的样本量再加10%作为实际样本量。,(二)决定样本大小的因素:,估计的非暴露组的发病率P0(常

13、用一般人群发病率代替非暴露组发病率)。暴露人群的发病率P1。所希望达到的检验显著性水平():越小,所需样本量越大。通常取0.05或0.01。所希望达到的检验把握度(1-),也称检验效力,要求(1-)越大,则需要的样本量也越大。通常取0.10。,(三)利用公式计算样本大小,队列研究样本含量计算公式为: 式中P1暴露组发病率、P0为非暴露组发病率,q1=1-p1, q0=1- p0, p=( p0+ p1)/2, q=1-p,Z和Z分别为与、值相对应的标准正态分布分位数(参见表)。,标准正态分布的分位数表或 Z(单侧检验) Z(双侧检验) Z(单侧和双侧)0.001 3.090 3.2900.00

14、2 2.878 3.0900.005 2.576 2.8070.010 2.326 2.5760.020 2.058 2.3260.025 1.960 2.2420.050 1.645 1.9600.100 1.282 1.6450.200 0.842 1.282,五、观察结局的确定,观察结局是指追踪观察中出现的预期结果的事件。通常以疾病发生为观察结局。也可将因该病死亡作为观察结局。 判断结局标准应尽量采用国际或国内统一的标准。 可以同时收集到多种结局资料,故非预定结局的疾病或死亡的信息也要收集。,六、混杂因素的确定,在队列研究追踪随访以前,除了要测量暴露因素外,还要确定和测量混杂因素。因为在

15、评价暴露因素与疾病之间联系时,如果在研究设计和分析中没有注意和控制混杂因素的作用,将不能正确估计暴露因素与疾病之间的联系。分析阶段用分层分析、logistic模型或Cox模型控制混杂因素,以准确地估计暴露因素与疾病之间的因果联系。,七、调查表格的制定、调查人员的培训,见病例对照研究,八、资料的收集,(一)基线资料的收集查阅现存的有关记录资料:如医院的病案,工厂的工作档案,工作日志、个人健康保险档案等。访问研究对象或其它能够提供信息的人:了解对象的暴露史、疾病史、及其它有关资料。对研究对象作健康与疾病的特殊项目检查:如测定他们的血压、血糖、血脂等,同时应作结局疾病的检查,以剔除已患结局疾病的不合

16、格对象。环境因素的实地检测:如果暴露或影响因素为环境因素,则应对环境进行检测。如环境污染的测定,食物成分的测定等。,(二)随访资料的收集,随访目的随访对象随访内容随访期限随访人员随访方法,强调:对暴露组和对照组应采取相同的随访方法,且在整个随访过程中,随访方法应保持不变。,1. 随访目的,确定研究对象是否仍处于观察之中,即确 定分母信息;确定研究人群中的结局事件,即确定分子信息;进一步收集有关暴露因素和混杂因素的资料,以备分析时用。,2. 随访的对象,所有被选定的研究对象,无论是暴露组或对照组都一律同等地同时间地进行随访,都坚持追踪到观察终止期。有时还必须对失访者进行补访。未能追访到的,应尽量

17、了解其原因,以便进行失访原因分析,估计有无产生偏倚。,3. 随访方法,查阅记录或档案:利用常规登记的人群和疾病资料来随访研究对象。在一些发达国家,每个公民都有一个全国计算机连网的个人识别号,通过它可查到有关就业、医疗、死亡等情况。在我国,可利用人事档案、肿瘤报告、传染病报告、死亡证明等记录与档案。进行专门随访:访问研究对象或其他能够提供信息的人,定期家庭访视、电话询问或通信等。进行测定或检查:如做体格检查或测定他们的血压、血脂、血糖等。环境做调查与检测,以确证一项暴露。如对水质进行化验,测定环境污染、食物成分等。,4. 随访的内容,随访内容应与获得基线资料时的完全一样,但收集的重点是结局变量,

18、其具体项目视研究目的与研究设计而不同。各种追踪观察项目应制成调查表或各项检查记录表,使用时贯彻始终,不得改变,直至观察终止。,5. 观察的终点:,观察终点指观察对象出现了预期的结果,常为规定的疾病的发生或死亡。至此就不再继续观察该对象了。观察终点是疾病或死亡,但也可是某些指标的变化,如血清抗体的出现,尿糖转阳及血脂升高等。对观察终点的判断应在设计中订出明确的标准,规定明确的判断方法,这种规定自始至终不能改变,发现终点的方法要敏感、可靠、简单、易被接受。,6. 观察的终止时间,观察终止时间是指整个研究工作可以得出结论的时间,也可说此时整个研究工作到达了终点,应以暴露因素作用于人体至产生结局的一般

19、潜伏期作为确定随访期限的依据。,7. 随访的间隔,间隔与次数视具体研究的需要而定,如果观察时间较短,在观察终止时一次搜集资料即可。反之需多次随访。如:英国以医生为对象进行的吸烟与肺癌的队列研究,也历时20余年,分别于1957,1966和1972年进行三次随访。,8. 随访人员的确定,专门训练的调查员进行随访调查,实验室的技术人员进行测定,临床医生进行终点判断。研究者可以参加随访但不一定非亲自参与,因为研究者易于带来主观的偏性,反而不如不知情的局外人士能够获取更客观的信息。当采用单盲或双盲手段获取信息时,更不能由研究者自己进行追踪。,9. 注意事项,随访中确定结局情况的方法在暴露组与非暴露组应当

20、一致。如果以死亡为观察结局时,不能简单地接受死亡证书的诊断,还要从临床病历收集其他资料,如病理诊断、实验室诊断、尸检结果,以进一步核实死亡原因。用定期健康检查方法收集结局资料时,最好采用双盲法。在随访期间,暴露组和非暴露组的观察对象可能改变原来暴露于暴露因素的状态,要注意收集这些资料。,第三节 数据资料的整理分析,资料的基本整理模式率的计算效应估计,队列研究资料分析主要任务,计算暴露组与非暴露组的发病率或死亡率,比较暴露组与非暴露组发病率或死亡率之间的差异,以分析评价暴露因素与疾病之间是否存在因果联系。根据研究目的的不同,队列研究可以计算累积发病率或发病密度。,一、资料的基本整理模式,暴露组发

21、病率=a/n1非暴露组发病率=c/n0,表4-3 队列研究资料归纳整理表,注意区分病例对照研究的资料整理表!,二、率的计算:,累积发病率(CI)发病密度(ID)标化率标化死亡比标化比例死亡比,变化范围 01 适用条件 样本大 人口稳定 整齐的资料 报告时必须注明时间长短,累积发病率 (cumulative incidence),CI=,观察期内发病(或死亡)人数,观察开始时的人口数,例如,1960年Cassel等人为探讨血液中儿茶酚胺与冠心病之间的联系,在美国Georgia州Evans县选择609名40至76岁白人无冠心病男子作为观察对象。根据血液中的儿茶酚按的水平将观察对象分为两组,122名

22、儿茶酚胺水平高者为暴露组,487名儿茶酚胺水平低者为非暴露组。然后追踪观察7年。随访观察结果见表8-2。 表8-2 儿茶酚胺与冠心病关系的队列研究结果 发生冠心病 未发生冠心病 合计 暴露组 27 95 122 非暴露组 44 443 487 合 计 71 538 609 暴露组累积发病率=27122100%=22%。 非暴露组累积发病率=44487100%=9%。,发病密度 (incidence density),变化范围 0 适用条件 观察时间长 人口不稳定 存在失访 资料很整齐,ID =,观察期内发病(或死亡)人数,观察人时,1、公式,2、 时间单位1)发病密度有时间单位,可用年、月、日

23、、时等表示,但最常用的是年,即以人年为单位计算发病率或死亡率。2)另外,随着时间单位的改变,发病密度的“数值”也可发生变化,但其实际测量值大小是不变的。,为什么计算人时?,队列研究由于跨时间较长,观察对象经常处于动态之中,队列内对象被观察的时间可能很不一致,因此以人为单位计算率就不合理。较合理的办法是加入时间因素,以人时来计算观察对象的暴露经历。,3、人时的计算方法:常用的是暴露人年。(1)以个人为单位计算暴露人年: 该法结果精确,但手工计算很费时间,一般需选用恰当的计算机程序。,(2)用近似法计算暴露人年 应用:不知道每个队列成员进入与退出队列的具体时间(精确到天);如果研究样本太大;对暴露

24、人年计算的精确性要求不高时,都可应用近似法计算暴露人年。可用平均人数乘以观察年数得到总人年数。平均人数取相邻两时段人口平均数或年中人数。,(3)用寿命表法计算人年 当观察对象人数较多,难以用以个人为单位计算暴露人年的方法,但又要求有一定的精度时,可利用简易寿命表的方法。,假设随访观察101人,观察时间为3年。如果在3年内101人中没有发生疾病,也未发生失访,每个人观察了3年,暴露人年为1013=303人年;如果在观察3年期间内,观察到1年时出现1个病例,观察至2年时出现2个病例,其余98人观察了3年,那么暴露人年为11+22+983=299人年,其发病率密度表示为ID=3/299人年0.01/

25、人年,标化死亡比 (standardized mortality ratio SMR),变化范围 0 适用条件 结局事件的发生率低 不宜直接计算率时,=,全人口某病的发病(死亡)率观察人口数,预期发病(死亡)数的计算:,SMR=1 研究人群某病发病(死亡)危险=标准人群 SMR1 研究人群某病发病(死亡)危险标准人群,是标准人群的SMR倍 SMR1 研究人群某病发病(死亡)危险1时,说明存在“正”的暴露与疾病联系,暴露因素是一种危险因素,或有害因素。RR1时,说明存在“负”的暴露与疾病联系,暴露因素是一种保护性因素,或有益因素。,意义 吸烟者因肺癌死亡的危险是非吸烟者的10.7倍 吸烟者因心血

26、管疾病死亡的危险是非吸烟者的1.7倍,心血管疾病,170.32,1.7,(1/10万人年),表4-5 RR与关联强度,RR的95%可信限:,RR本为根据样本量算出的暴露与疾病关联的点估计值。用点估计推断总体的范围,需计算其可信区间(通常用95%可信区间)。,RR的95%CI,RR95%CI计算方法:,反自然对数即为RR95%CI,Woolf法,ln,ln,归因危险度 (Attributable Risk, AR ):又叫特异危险度、率差(rate difference, RD)和超额危险度(excess risk),是暴露组发病率与对照组发病率相差的绝对值,它表示危险特异地归因于暴露因素的程度

27、。,意义RR 吸烟对肺癌的病因学意义较大AR 戒烟对心血管疾病的预防作用较大 即公共卫生意义较大,表4-6 RR与AR的区别,(1/10万人年),RR AR 相同 表示联系强度的指标 不同 RR=Ie/I0 AR=IeI0主要测量相对效应 主要测量绝对效应暴露对于个体增加 暴露对于人群增加发生危险的倍数 超额危险的比例 病因学的意义 疾病预防和 公共卫生学的意义,RR与AR的异同点,归因危险度百分比AR%:又称为病因分值(etiologic fraction, EF),是指暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。,RR,人群归因危险度 (population attri

28、butable risk, PAR) 是指总人群发病率中归因于暴露的部分。,PAR = ItI0,It :总人群率Io:非暴露组率,人群归因危险度百分比 (PAR%):也叫人群病因分值(population etiologic fraction, PEF),是指PAR占总人群全部发病(或死亡)的百分比。,或,Pe:总人群的暴露比例,分析方法列出不同暴露水平下的发病率以最低暴露水平组为对照,计算各暴露水平的RR和危险度差(RD)必要时,应对率的变化作率的趋势性检验,剂量反应关系,结果,随着每日吸烟量的增加,肺癌死亡率、RR和AR均增大说明存在剂量效应关系,肺癌死亡率与吸烟量的关系,吸烟量(支/天

29、),肺癌死亡率(),RR,AR,不吸烟,0.07,1.00,0.00,114,0.57,8.14,0.50,1524,1.39,19.86,1.32,25+,2.27,32.43,2.20,选择偏倚 失访偏倚 信息偏倚 混杂偏倚,第四节 偏倚及其控制,一、选择偏倚(selection bias),研究人群在一些重要因素方面与一般人群或待研究的总体人群存在差异,而导致研究结果的偏倚。,产生原因 选择对象的方法不当 最初选定参加研究的对象中有人拒绝参加 历史性队列研究中部分档案丢失或记录不全 志愿者队列 研究开始时未能发现早期病人等,预防为主,抽样方法正确,严格按规定标准选择对象,控 制,二、失访

30、偏倚(lost to follow-up),研究对象因迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列所引起的偏倚。,控 制,设计 选择便于随访的人群 在计算的研究样本的基础上扩大10% 实施 加强对随访人员的管理 制定随访计划和监测措施 期中分析 整理资料 对于有缺项或漏项的对象进行补查,三、信息偏倚(information bias),在获取暴露、结局或其他信息时所出现的系统误差或偏差。,产生原因,疾病、暴露标准不明确检验仪器不精确、检验技术不熟询问技巧不佳记录错误,造假等,控 制提高临床诊断技术、明确各项标准选择精确稳定的测量方法事前调准仪器严格实验操作规程同等对待每个研究对象培训

31、调查员,提高技巧,统一标准,四、混杂偏倚 (confounding bias),研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系。,控 制,设计阶段 限制研究对象,匹配分析阶段 分层分析、标准化或多因素分析,第五节 优点与局限性,一、优 点,直接获得暴露组和非暴露组的发病率或死亡率 直接估计危险度 符合时间顺序,验证病因的能力较强 获得一种暴露与多种结局的关系 收集的资料完整可靠,不存在回忆偏倚 可研究疾病的自然史,二、缺 点,不适于发病率很低的疾病的病因研究 易发生失访偏倚 耗时,耗人力、物力、财力 设计要求严密,资料的收集和分析难度较大 随访过程中,已知变量的变化或未知变量的引入增 加分析难度,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。