1、队列研究(群组研究)(cohort study),前瞻性研究: prospective study; 发生率研究: incidence study;随访研究: follow-up study;纵向研究: longitudinal study,一基本原理 队列与队列研究的定义,Cohort: 流行病学中队列一词常用于指有共同经历或有具有共同状态的一群人。Cohort study: 选定暴露于及未暴露于某因素的两组人群,随访观察一定的期间,比较两组人群某种事件的结局(一般指疾病的发病率或死亡率),从而判断该暴露因素与发病或死亡有无关联及关联大小的一种观察性研究方法。,病因和危险因素研究是流行病学研
2、究的重要任务,病因研究的逻辑顺序应该是先有病因存在,然后有疾病发生。 因 果,N,目标人群,代表性样本,Y,E,时间顺序,暴露,结局,Y,N,概 念,暴露(exposure) 指接触过某种物质、具备某种特征或处于某种状态。 队列(cohort) 有共同经历或有共同暴露特征的一群人 分为固定队列和动态队列危险因素(risk factor) 泛指能引起某特定不良结局(outcome),或使其发生的概率增加的因子,包括个人行为、生活方式、环境和遗传等多方面的因素。,固定队列 Fixed Cohort,研究开始,研究结束,出现结局,未出现结局,动态队列 Dynamic Cohort,研究开始,研究结束
3、,出现结局,失访,队列研究的历史,早期:十九世纪中叶,队列研究的雏形出现于一些传染病的调查中,Jone Snowl伦敦的霍乱调查,基于对比思想的自然实践。距离霍乱病因的阐明还有很长的时间!中期:二十世纪上半叶,西方工业发展过程中,人们注意到了特定职业的疾病危害,出现了应用于职业危险因素的长期作用的回顾性历史队列研究。值得注意的是,当时许多的职业危害因素,采取措施降低危险因素,可以减少疾病的发生,但是,很多机理尚是一个迷! 最早的队列研究一词出现是美国流行病学家1935年提出。但是他的研究,是基于出生队列的死亡率研究,与今天队列研究的含义不同。3. 二战以后才开始真正发展。,队列研究的历史,现代
4、队列研究作为一种流行病学研究的方法,已经得到广泛地应用。数量变化:Medline 检索,1966年,1346篇,1976年,4220篇,1986年,9879篇,1996年,20012篇。十年翻一番!著名的研究:20世纪50年代先后有著名的队列研究:doll关于医生吸烟与肺癌的队列研究;美国佛明汉的心脏病研究;原子弹爆炸幸存者研究;,(二) 特点, 属于观察法 设立对照组 由“因”及“果”,时序合理 检验露因素与疾病的因果联系科学性强,(三)用途,1.检验病因假设( hypothesis) 验证某种暴露因素对某种疾病发病率或死亡率的影响,也可同时观察某种暴露因素对人群健康的系统影响。2.描述疾病
5、的自然史( natural history of disease) 疾病的自然发展过程,包括疾病的起病(病理发生期)、潜伏期(隐伏期)、临床前期、临床期到结局的全过程。,(三)用途,3.评价预防措施效果 验证某种非人为行为和习惯(预防措施)变化产生的健康影响。如戒烟,食用大量蔬菜对肠癌的影响。4.药物的上市后监测 对于通过临床三期临床试验的治疗药物,上市后,监测人群用药的安全性、有效性。,(四) 设计类型,队列研究可分为三类: 前瞻性队列研究 历史性队列研究 双向性队列研究,时间顺序,过去,现在,将来,历史性队列,双向性队列,前瞻性队列,回顾性收集已有的历史资料,继续前瞻性收集资料,前瞻性收集
6、资料,1.前瞻性队列研究,研究对象的分组是根据目前的暴露情况,研究的结局需随访观察一段时间才能得到。这是队列研究的基本形式。 特点: 最大优点是可以获取相对真实而可靠的资料;但是如果需要观察大量人群,则花费太大;如果疾病的潜伏期很长,则需要观察的时间很长。这些都会影响其可行性。,1.前瞻性队列研究的条件,研究的检验假设明确;研究的疾病的率不太低,不低于5;暴露因素明确,且能有效测量;结局明确,并有简洁可靠的手段确定;有足够的研究人群;队列能够有效的随访;有足够的物质、人力、资金的保证,2. 历史性队列研究,研究工作是现在开始的,研究对象的分组是过去某个时间,研究的结局在研究开始时已经发生,暴露
7、到结局的方向是前瞻性的。特点:节省时间、人力和物力,出结果快,因而适宜于长诱导期和长潜伏期的疾病;常用于具有特殊暴露的职业人群的研究;研究常常缺乏影响暴露与疾病关系的混杂因素的资料,以至影响暴露组与未暴露组的可比性。,2. 历史性队列研究的条件,具备前瞻性队列条件外,还应具备: 足够数量的、完整可靠的、在过去时段的研究对象的暴露和结局的历史纪录。,3. 双向性队列研究,在历史性队列研究之后,继续进行前瞻性队列研究叫双向性队列研究(ambispective cohort study)。这种研究具有上述两种研究的优点,在一定程度上弥补了它们的不足。,3. 双向性队列研究的条件,基本具备历史性队列研
8、究条件下,如果暴露到现在的观察时间不足,且有条件继续进行观察,则可采用双向性队列。,二研究实例,石棉肺与肺癌,美国和加拿大的Mount-sinai研究,目地:研究石棉与多种疾病的关系研究对象:四个接触石棉粉尘的职业人群对照:一般人群随访时间:2030年指标:SMR(标准化死亡比),暴露:接触石棉环境的职业人群结局:各种疾病原因的死亡假设:石棉可以引起死亡的增加,结果,全死因:SMR 1.411.64 合计 1.47所有肿瘤:SMR 2.593.86 合计 3.26 肺癌:SMR 3.217.62 合计 5.31胃肠道肿瘤:SMR 1.613.17 合计 2.06说明了石棉与肺癌联系的强度与普遍
9、性,三队列研究的实施(一)确定设计方法的原则,1.前瞻性队列研究(1) 有明确检验假设;(2) 所研究疾病的发病率或死亡率一般不应低于5;(3) 有把握获得观察人群的暴露资料;(4) 有确定发病或死亡等结局的简便而可靠的手段;(5) 有把握获得足够数量的观察人群,并且该人群能 被长期随访观察而取得完整可靠的资料;(6) 有足够的人力、物力和财力。,(一)确定设计方法的原则,2 . 历史性队列研究(1)有足够数量完整可靠的有关暴露的记录或档案材料;(2)有可靠的的疾病诊断资料;(3)可获得有关暴露与疾病关系的混杂因素的资料。,(二)确定暴露因素,暴露因素:可疑的致病因素或保护因素。暴露因素通常是
10、在描述性研究或病例对照研究的基础上确定的。暴露因素应尽可能给以定量,并且除了暴露剂量水平外,还应当考虑暴露的时间长度,以及暴露是否连续。除了要确定主要的暴露因素外,也应同时收集其它次要的暴露因素资料及一般特征资料。,主要暴露因素 在描述性研究和病例对照研究的基础上确定,确定研究因素,可能影响结局的因素 混杂因素 人口学特征等,暴露测量,性质 定性(quality) 定量(quantity) 方法 访谈 实验室检查 查阅记录,暴露因素的变化,随着科学进步,暴露因素的概念和测量技术手段得到发展和完善。暴露的因素。从单纯的生物学因素,发展到心理社会方面,不仅仅是危险因素,还有保护因素;测量手段大大改
11、善:暴露水平的测量已经从宏观群体水平发展到个体水平,分子水平。,(三)确定结局,结局(outcome)指研究者预期的结果事件。结局不仅限于发病,还有死亡和各种化验指标,如血清抗体的滴度,血脂、血糖达到一定水平等。结局事件指研究对象个体而言,与观察期的终点不是一个概念。判断结局的标准应尽量采用国际或国内统一标准。需考虑到疾病的不同类型,不同临床表现等,应注意记录下其他可疑的症状或现象供以后详细分析。,结局是研究队列中预期结果事件,发病或死亡 血清指标 分子标志的变化 定性或定量,二、确定研究结局,一次研究可有多个结局,吸烟,吸烟,慢性支气管炎,冠心病,肺癌,结局的测量 采用国际或国内通用的标准,
12、有足够符合条件的研究对象领导重视、群众支持医疗条件较好,交通较便利发病率较高有代表性,三、确定研究现场与研究人群,研究现场,从目标人群中抽出的具有代表性的人未患所研究疾病 分为暴露人群和非暴露人群,研究人群,(四)确定研究人群, 暴露人群的选择 - (1)特殊暴露人群 (2)一般人群 (3)有组织的人群团体(4)志愿者, 特殊暴露人群,指对某因素有高的暴露水平的人群。如果暴露因素与疾病有关,则高度暴露的人群中疾病的发病率或死亡率就可能高于其他人群,这将有利于探索暴露与疾病之间的联系。 在研究暴露与疾病的关联时,常常首先选择特殊暴露人群。某些职业中常存在特殊暴露因素,可能与某些疾病有关。所以某些
13、职业人群也是特殊暴露人群。 选择特殊暴露人群做队列研究时,常用历史性队列研究。, 一般人群,指某行政区划或地理区域内的人群中暴露于所研究因素的人作为研究人群。选择指征:无特殊暴露人群或不需要特殊暴露人群。所研究的因素与疾病是人群中常见的;计划观察一般人群的发病情况。, 有组织的人群团体,指作为一般人群的特殊形式,如医学会会员、工会会员等某些群众组织或专业团体成员,参加人寿保险或医疗保险的人员等。 优点:便于有效率地收集随访资料。 缺点:研究结果有一定局限性。, 对照人群(非暴露人群)的选择,(1)原则 对照人群除未暴露于所研究的因素外,其它各种因素或人群特征(年龄、性别、职业、文化程度等的构成
14、)应尽可能地与暴露人群相同。,非暴露人群选择,内对照(internal controls) 一群研究对象内部外对照(external controls) 一群研究对象外部总人口对照(total population controls) 整个地区现成的发病或死亡资料多重对照(multiple controls) 两种或以上的对照形式,(2)方式 1)内对照 在同一研究人群中,采用没有暴露或暴露水平最低的人员作为对照即为内对照。 队列研究应尽量选用内对照,因为除暴露因素外,它与暴露人群的可比性好。但研究环境或职业暴露时难以实施。(非暴露组被“污染”),2)外对照(特设对照) 职业人群或特殊暴露人群
15、常需在该人群之外特设对照组,叫外对照。 优点:避免了“污染”; 缺点:可比性受一定影响,工作量增大。,3)一般人群对照 研究中不选择特殊对照,暴露人群的发病率与一般人群进行比较。 优点:一般人群的发病率或死亡率比较稳定且较容易得到。节省大量的经费和时间。 缺点:资料不够全面,不精确或缺乏要比较的项目;与暴露人群的可比性较差;,4) 多种对照 为了增强判断依据,可将上述方法综合起来,设立多种对照,进行多重比较。,(五)确定样本大小,队列研究的样本量主要大小取决于四个参数:一般人群中所研究疾病的发病率水平p0 , p0越接近0.5,所需观察的人数越少;暴露人群的发病率p1 用一般人群发病率p0代替
16、非暴露组的发病率。两组之差 d= p1-p0,d值越大,所需观察人数越少;RR值越大,所需观察人数越少;显著性水平 即检验假设时的第I类错误值,把握度 (power),即1-,计算样本量时需考虑的问题抽样方法暴露组与非暴露组的比例失访率,四、确定样本量,:两个发病率的平均值,P1:暴露组预期发病率P0:对照组预期发病率,样本大小的估计:查表公式计算(条件 暴露组和对照组样本含量相等),(六)资料的收集,1需收集资料种类:暴露、结局、可能产生混杂的因素。2基线资料的收集: 已有的记录 询问调查 体格检查 环境检测3随访观察随访的内容与方法确定随访的间隔确定随访期限与观察终点随访中的偏倚及控制(失
17、访问题、测量错误等),(六)资料的收集,现在队列研究资料收集的发展趋势,是充分利用可以利用的一切信息,重点是利用常规资料!,队列研究分析资料的基本整理模式,暴露组发病率=a/n1非暴露组发病率=c/n0,表4-3 队列研究资料归纳整理表,四资料的整理和分析,(一) 率的计算 累积发病率(cumulative incidence,CI) 当观察人口比较稳定时,不论观察时间长短,以开始观察时的人口数为分母,整个观察期内发病人数为分子,得到该观察期的累积发病率。 观察期间发病人数 累积发病率=- 观察队列人数,变化范围 01 适用条件 样本大 人口稳定 整齐的资料 报告时必须注明时间长短,累积发病率
18、 (cumulative incidence),第四节 资料的整理和分析,CI=,观察期内发病(或死亡)人数,观察开始时的人口数,发病密度 (incidence density),变化范围 0 适用条件 观察时间长 人口不稳定 存在失访 资料很整齐,第四节 资料的整理和分析,ID =,观察期内发病(或死亡)人数,观察人时, 发病密度(incidence density,ID),当观察的人口不稳定,观察对象进入研究的时间先后不一,以及各种原因造成失访,因此每个观察对象随访的时间不同,用总人数为单位计算率是不合理的。此时可以用人时(person-time)为单位计算率, 由此得到的发病率称为发病密
19、度。人时即观察人数乘以观察时间。时间单位可用年、月、日、时等,但最常用的是年,即以人年(person-year)为单位计算发病率或死亡率。,(二)人时的计算,常用的单位是人年,人月。 用人时为计算率的分母优点是能够充分利用信息,资料可靠;缺点是计算烦琐,有时意义不清,频率之间不可比。 精确法 近似法 寿命表法,标化死亡比 (standardized mortality ratio SMR),变化范围 0 适用条件 结局事件的发生率低 不宜直接计算率时,第四节 资料的整理和分析,SMR=1 研究人群某病发病(死亡)危险=标准人群SMR1 研究人群某病发病(死亡)危险标准人 群,是标准人群的SMR
20、倍 SMR1 研究人群某病发病(死亡)危险标准人群,SMR的意义 被研究人群发生(死于)某病的危险性是标准人群的多少倍,标化比例死亡比 (standardized proportional mortality ratio,SPMR),变化范围 0 适用条件 不能得到历年人口资料 仅有死亡人数、原因、日期和年龄,(三) 暴露与疾病关联的指标,四、效应的估计,相对危险度 归因危险度 归因危险度百分比 人群归因危险度 人群归因危险度百分比 剂量反应关系,1. 相对危险度(relative risk,RR),1951年,Cornfied提出了相对危险度和比值比的概念和计算方法。该指标是反映暴露与发病或
21、死亡关联强度的指标,也叫危险比(risk ratio,RR), 其本质是率比(rate ratio,RR), 为暴露组的率与未暴露组的率之比。RR=Ie/Io=(a/n1)/( c/n0),相对危险度(Relative Risk RR ),意义E发病或死亡的危险是的多少倍RR值 暴露的效应 暴露与结局关联强度,第四节 资料的整理和分析,暴露组率,非暴露组率,表4-5 RR与关联强度,2. 归因危险度(attributable risk,AR),也叫特异危险度、超额危险度(excess risk),其本质为率差(rate difference,RD),为暴露组的率与未暴露组的率之差。说明由于暴露
22、增加或减少的率的大小。AR=Ie-Io=a/n1-c/n0,归因危险度 (Attributable Risk, AR ),意义E与 人群比较,所增加的疾病发生数量AR值 暴露因素消除后所减少的疾病数量,第四节 资料的整理和分析,c,a,RR与AR都说明暴露的生物学效应,但不能说明其对一个人群的危害程度以及消除这个因素后可能使发病率或死亡率减少的程度,即暴露的社会效应。 人群中的暴露比例会影响人群中的归因危险,除非研究对象两组的暴露比例恰好与人群中的一致。,归因危险度百分比AR%(病因分值EF),意义 暴露人群中的发病或死亡归因于暴露的部分占 全部发病或死亡的百分比,RR,人群归因危险度 (po
23、pulation attributable risk, PAR),意义暴露人群与一般人群比较,所增加的疾病发生率的大小PAR值 暴露因素消除后所减少的疾病数量,PAR= ItI0,It:总人群率Io:非暴露组率,假设如下数据,计算有关各指标: 吸烟者肺癌年死亡率为Ie=0.96, 非吸烟者肺癌年死亡率为Io=0.07, 全人群中肺癌死亡率为It=0.56,则:RR=Ie/Io=0.96/0.07=13.7 AR= Ie-Io=0.96-0.07=0.89 AR%=(Ie-Io)/Ie100%=92.7% PAR=It-Io=0.49 PAR%=(It-Io)/It100%=87.5%,(四)分
24、层分析与剂量反应关系,队列研究中的分层分析与病例对照研究中的相应部分方法、意义类似。,分层分析,1959年,Mantel 和 Hsenszel提出了分层分析方法。分层分析是把人群根据某种特征分为不同层次(层),如性别、年龄等,分别分析各层中暴露与疾病的关联。分析分析的目的是控制混杂因素,调整这些因素的干扰估计混杂因素对暴露因素与结局之间关联关系的影响大小。,分层分析,如果层间的RR值接近,说明两个层是同质的(Homogeneous)层间的RR同质的显著性检验一般是采用Woolf的齐性检验法检验,可参考病例对照研究和相关的统计书。,其它的分析技术,80年代后期,把多元统计分析,引入队列研究的资料
25、分析,极大的丰富了分析手段;环境流行病学的空间模型和时序分析,考虑了相互作用和因果关系的时间效应。,队列研究设计技术的发展,60年代,Miettinen提出了配比设计,偏倚概念,混杂及其效应修正的概念与研究技术,使得研究的结果更加准确;交叉式设计的发展,1973年,Mentel提出了巢式病例对照研究设计,1975年,Kupper提出了病例队列设计,使得能充分利用现有大量的生物学标记物信息,实现:避免了疾病诊断后才进行生物暴露测量,减少了误差;增加研究的可行性,大大减少样本量;,五、队列研究常发生的偏倚及其防止, 常发生的偏倚1.选择偏倚(selection bias) 由于最初选定的研究对象有
26、人不能参加;进行历史性队列研究时,有些人的档案丢失或记录不全;研究对象为志愿者,他们往往是具有某些特征或习惯的;某些早期病人在研究开始时未能发现;或暴露与疾病的定义不严格,执行不当等。,在研究过程中,某些选定的研究对象因为种种原因脱离了观察,研究者无法继续随访他们,这种现象叫失访(loss to follow up),因此而造成对研究结果的影响成为失访偏倚。 队列研究由于观察人数较多,观察时间较长,失访是不可避免的。主要原因是研究对象迁移、外出、不愿再合作而退出或死于非终点疾病。失访所产生的偏倚的大小主要取决于失访率的大小和失访者的特征以及暴露组与非暴露组两组失访情况的差异。对研究结果产生偏倚
27、影响最大的是“高危人群”的失访。,2.信息偏倚(information bias) 主要为错分偏倚(misclassification bias)包括暴露错分和疾病错分以及暴露与疾病的联合错分。主要原因是使用的仪器不准确,检验技术不熟练,诊断标准定义不明确或掌握不当,询问技巧欠佳造成结果不真实等。若这种错分偏倚以同样的程度发生于观察的各组,则结果可能不会对各组之间的相对关系产生太大影响,但相对危险度的估计趋向于1,即会低估相对危险度,这种情况叫做非特异性错分。若这种错分发生于一组而不发生于另一组,则对相对危险度的估计的影响不确定,这种情况叫做特异性错分。危险度的估计值完全被歪曲。,3.混杂偏倚
28、(confounding bias) 混杂、混杂因素和混杂偏倚的概念同病例对照研究。队列研究中同样会发生混杂偏倚。,队列研究的伦理学问题,伦理学的几个基础性文件:1947年的国际纽伦堡军事法庭颁布的纽伦堡法典;1948年,联合国通过的世界人权宣言;1956年世界医学大会通过的赫尔辛基宣言(已经修改倒第五版),队列研究的伦理学问题,主要表现在三个方面:知情同意和自愿参加;保护个人隐私和资料的保密;可能发生的机体和心里损害的危险性;, 偏倚的控制,1.选择偏倚 严格按规定的标准选择研究对象;查明愿意加入和不愿意加入研究的两组人的差异;尽可能提高研究对象的依从性,在选择研究对象时选择那些符合条件并且
29、依从性好的研究对象。对于失访可能的影响应当做进一步估计。从各种途径了解失访者的最后结局,与被随访到的人群的结局进行比较,以推测失访的影响。,2.信息偏倚 提高设计水平和调查质量,做好质控明确各项标准,严格按规定执行,定期抽取一定比例的样本复查 3. 混杂偏倚 控制方法与病例对照研究相同。,六、队列研究的优缺点, 优点1.可以直接获得暴露组与非暴露组的发病率或死亡率,因而可以直接估计相对危险度。2.由于原因发生在前,结局发生在后,故检验病因假说的能力较强。3.有助于了解疾病的自然史并且可以获得一种暴露与多种疾病结局的关系。4.样本量大,结果比较稳定。5.可以了解基线率,因而能够发展和实施控制、预
30、防和健康促进规划。6.可以发现需要干预、治疗和控制的新病例的资料。7.所收集的资料完整可靠,不存在回忆偏倚。,缺点1.不适于发病率很低的疾病的病因研究2.由于长期的研究与随访,因为死亡、退出、搬迁等 造成的失访难以避免。3.研究费时间、费人力、花费高4.随着时间推移,未知的变量引入人群可能导致结局受影响。5.研究的设计要求高,实施难度大。,关于暴露的需要考虑的问题,传统暴露的测量是采用一个假设:暴露史的数量综合来决定当前的暴露。存在的问题:1.人时分类慢性暴露暴露发生时间与产生暴露效应的时间,关于暴露的需要考虑的问题,2.持续暴露暴露累计到一定的程度才能引起效应,关于暴露的需要考虑的问题,3.暴露对象的非暴露时间4.暴露的划分暴露时间分配到最适合的最高暴露组5.暴露强度,关于暴露的需要考虑的问题,6.无死亡人时队列研究的结局是以死亡为终点。观察某种暴露的作用。但是规定的研究期间,没有发生死亡。,我国的队列研究现状,我国大型的队列研究起步于20世纪70年代;主要针对的是慢性非传染性疾病的研究。现在在传染性疾病中已有应用。1992年11省市心血管危险因素队列研究(19881994年);出生缺陷研究;妇女妊娠早期补充叶酸与多胎妊娠关系的研究;职业病研究:80年代多部委参加的职业性因素与肿瘤关系的研究。,