1、流行病学,谭红专 中南大学,第四章 队列研究(Cohort Study),引言,病因和危险因素研究是流行病学研究的重要任务,病因研究的逻辑顺序应该是先有病因存在,然后有疾病发生,即先因后果。 那么,怎样的研究满足先因后果的逻辑顺序,能更有效地证实因果关系呢? 队列研究。,引言,队列研究(cohort study)是分析流行病学研究中两大重要方法之一。 它通过直接观察暴露于某因素不同状况人群的结局来探讨该因素与所观察结局的关系。,目录,第一节:概述,第二节:研究设计与实施,第三节:资料的整理与分析,第四节:常见偏倚及其控制,第五节:优缺点及其他实践类型,01,02,03,04,05,第一节 概述
2、,概述,概念 基本原理 研究目的 研究类型,1.暴露(exposure) 指接触过某种物质、具备某种特征或处于某种状态2.队列(cohort) 有共同经历或有共同暴露特征的一群人 分为固定队列和动态队列3.危险因素(risk factor) 泛指能引起某特定不良结局(outcome),或使其发生的概率增加的因子,包括个人行为、生活方式、环境和遗传等多方面的因素,(一)概念,第一节 概述,第一节 概述,固定队列 Fixed Cohort,出现结局,未出现结局,研究开始,研究结束,第一节 概述,动态队列 Dynamic Cohort,出现结局,研究开始,研究结束,失访,根据研究对象是否暴露于某研究
3、因素或其不同水平将研究对象分成暴露组(E)与非暴露组()随访一定时间,比较两组之间所研究结局(outcome)发生率的差异,以分析暴露因素与研究结局之间的关系,(二)基本原理,第一节 概述,第一节 概述,目标人群,代表性样本,暴露,E,结局,Y,时间顺序,(二)基本原理,Y,N,N,主要特点观察法设立对照由因到果,符合时间顺序检验暴露与结局的因果联系能力较强,(二)基本原理,第一节 概述,(三)研究目的,第一节 概述,1.检验病因假设 ( hypothesis)2.评价预防措施效果 (effect of prevention)3.研究疾病的自然史( natural history of dis
4、ease)4.新药的上市后监测,前瞻性队列研究(prospective cohort study)历史性队列研究(historical cohort study)双向性队列研究(ambispective cohort study),(四)研究类型,第一节 概述,第一节 概述,(四)研究类型,过去,现在,将来,回顾性收集已有的历史资料,历史性队列,继续前瞻性收集资料,双向性队列,前瞻性收集资料,前瞻性队列,时间顺序,前瞻性队列研究(prospective cohort study)研究队列的确定是现在(concurrent)根据研究对象现在的暴露分组需要随访(follow-up)结局在将来某时刻
5、出现,(四)研究类型,第一节 概述,前瞻性队列研究(prospective cohort study)优点时间顺序增强了病因推断的可信度直接获得暴露与结局资料,结果可信能获得发病率缺点所需样本量大,花费大,时间长 影响可行性,(四)研究类型,第一节 概述,前瞻性队列研究的应用条件有明确的检验假设所研究疾病的发生率较高,一般不低于5明确规定暴露因素和结局变量有可靠的测量手段能获得足够的观察人群和他们的暴露情况大部分人群能完成随访有足够的人力、财力、物力,(四)研究类型,第一节 概述,历史性(回顾性)队列研究 historical (retrospective) cohort study根据研究开
6、始时研究者掌握的有关研究对象在过去某时刻的暴露情 况的历史材料分组。不需要随访,研究开始时结局已出现。,(四)研究类型,第一节 概述,历史性(回顾性)队列研究historical (retrospective) cohort study 优点短期内完成资料的收集和分析时间顺序仍是由因到果省时、省力、出结果快缺点资料积累时未受到研究者的控制,内容上未必符合要求需要足够完整可靠的过去某段时间有关研究对象的暴露和结局的历史记录或档案材料,(四)研究类型,第一节 概述,双向性队列研究 mixed (ambispective) cohort study研究队列的确定是过去根据研究对象过去某时刻的暴露情况
7、分组需要随访部分结局可能已出现,(四)研究类型,第一节 概述,双向性队列研究 mixed (ambispective) cohort study优点 是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式,因此兼有上述二类的优点 。应用 当基本具备进行历史性队列研究的条件下,如果从暴露到现在的观察时间还不能满足研究的要求(人时不够,未满足效应期),还需继续前瞻性观察一段时间时,则选用双向性队列研究。,(四)研究类型,第一节 概述,第二节 研究设计与实施,设计和实施,确定研究因素 确定研究结局 确定研究现场与研究人群 确定样本量 资料的收集与随访 质量控制,主要暴露因素 在描述和病例对照研究的
8、基础上确定可能影响结局的因素 混杂因素 人口学特征等因素的测量 需测量暴露的水平,暴露的时间,及暴露的方式。暴露的测量应采用敏感、精确、简单和可靠的方法性质 定性(quality),定量(quantity)方法 访谈,实验室检查,查阅记录,(一)确定研究因素,第二节 研究设计与实施,结局是研究队列中预期结果事件,是队列研究的自然终点(natural end)。研究结局的确定应全面、具体、客观。可包括:发病、死亡、健康状况和生命质量终极结果(发病)或中间结局(血清变化)正面(生命延长)和负面(发病)定性或定量可多个或多方面,(二)确定研究结局,第二节 研究设计与实施,一次研究可有多个结局,(二)
9、确定研究结局,第二节 研究设计与实施,吸烟,慢性支气管炎,肺癌,冠心病,结局的测量 采用国际或国内通用的标准,研究现场有足够符合条件的研究对象领导重视、群众支持医疗条件较好,交通较便利发病率较高有代表性,(三)确定研究现场与研究人群,第二节 研究设计与实施,研究人群从目标人群中抽出的具有代表性的人未患所研究疾病 分为暴露人群和非暴露人群,(三)确定研究现场与研究人群,第二节 研究设计与实施,暴露人群选择职业人群特殊暴露人群一般人群有组织的人群团体,(三)确定研究现场与研究人群,第二节 研究设计与实施,非暴露人群选择内对照(internal controls) 一群研究对象内部外对照(exter
10、nal controls) 一群研究对象外部总人口对照(total population controls) 整个地区现成的发病或死亡资料多重对照(multiple controls) 两种或以上的对照形式,(三)确定研究现场与研究人群,第二节 研究设计与实施,计算样本量时需考虑的问题 抽样方法暴露组与非暴露组的比例(1:1)失访率,(四)确定样本量,第二节 研究设计与实施,影响样本量的因素 非暴露人群或全人群中所研究疾病的发病率p0 暴露人群与对照人群疾病发病率之差p1-p0 第一类错误概率 把握度(power) 1-,(四)确定样本量,第二节 研究设计与实施,样本大小的估计查表公式计算(条
11、件 暴露组和对照组样本含量相等),(四)确定样本量,第二节 研究设计与实施,:两个发病率的平均值,P1:暴露组预期发病率P0:对照组预期发病率,样本大小的估计,(四)确定样本量,第二节 研究设计与实施,已知 p0=0.003,RR=2.5,=0.05,=0.1 计算样本量 根据上述条件 Z=1.96, Z=1.282 ,q0=0.997 p1=p0RR=0.0075,q1=0.9925 代入公式得 N=5420 考虑到失访,实际上每组再扩大10%,即每组需5962人,基线资料 随 访 资料收集,(五)资料的收集与随访,第二节 研究设计与实施,基线资料 暴露的资料 个体的其他信息,(五)资料的收
12、集与随访,第二节 研究设计与实施,基线资料 随访(follow-up)随访对象、内容和方法随访间隔随访者观察终点(研究对象出现了预期的结果)观察终止时间(整个研究工作截止的时间),(五)资料的收集与随访,第二节 研究设计与实施,基线资料 随访(follow-up) 资料收集方式查阅纪录调查询问 健康或疾病检查环境监测等,(五)资料的收集与随访,第二节 研究设计与实施,调查员选择 调查员培训 制定调查员手册 监督,(六)质量控制,第二节 研究设计与实施,第三节 资料的整理与分析,资料的整理与分析,资料的基本整理模式 人时的计算 率的计算 显著性检验 效应估计,(一)资料的基本整理模式,第三节 资
13、料的整理与分析,队列研究资料归纳整理表,暴露组发病率=a/n1对照组发病率=c/n0,精确法:逐日相加 近似法:年头和年尾人数之和除以2 寿命表法:当年内进入或退出队列的个人均作1/2人年计算,(二)人时的计算,第三节 资料的整理与分析,累积发病率 发病密度 标化死亡比 标化比例死亡比,(三)率和比的计算,第三节 资料的整理与分析,累积发病率 (cumulative incidence),(三)率和比的计算,第三节 资料的整理与分析,CI=,观察期内发病(或死亡)人数,观察开始时的人口数,变化范围 01 适用条件 样本大 人口稳定 整齐的资料(固定队列) 报告时必须注明时间长短,发病密度 (i
14、ncidence density),(三)率和比的计算,第三节 资料的整理与分析,ID =,观察人时数,观察期内发病(或死亡)人数,变化范围 0 适用条件 观察时间长 人口不稳定 存在失访,标化死亡比 (standardized mortality ratio ,SMR),(三)率和比的计算,第三节 资料的整理与分析,变化范围 0 适用条件 结局事件的发生率低 不宜直接计算率时 以全人群为对照,预期发病(死亡)数的计算:,全人口某病的发病(死亡)率观察人口数,标化死亡比 (standardized mortality ratio ,SMR),(三)率和比的计算,第三节 资料的整理与分析,SMR
15、 的意义 被研究人群发生(死于)某病的危险性是标准人群的多少倍,SMR=1 研究人群某病发病(死亡)危险=标准人群SMR1 研究人群某病发病(死亡)危险标准人 群,是标准人群的SMR倍SMR1 研究人群某病发病(死亡)危险标准人群,标化比例死亡比 (standardized proportional mortality ratio, SPMR),(三)率和比的计算,第三节 资料的整理与分析,变化范围 0 适用条件 不能得到历年人口资料(无分母) 仅有死亡人数、原因、日期和年龄,预期死亡数计算=,U检验:当研究样本量较大,p和1-p都不太小 直接概率法:率比较低,样本较小时 二项分布检验 泊松(
16、Poisson)分布检验 检验:居中 计分检验(score test),(四)显著性检验,第三节 资料的整理与分析,2,相对危险度 归因危险度 归因危险度百分比 人群归因危险度 人群归因危险度百分比 剂量反应关系,(五)效应的估计,第三节 资料的整理与分析,相对危险度(relative risk,RR ) 通常包括了危险度比(risk ratio)或率比(rate ratio, RR),(五)效应的估计,第三节 资料的整理与分析,暴露组率,对照组率,意义 E发病或死亡的危险是的多少倍 RR值 暴露的效应 暴露与结局关联强度,第三节 资料的整理与分析,(五)效应的估计,发病密度,0.4959,1
17、5.63,意义 乙肝病毒感染者发生PHCC的危险是非乙肝病毒感染者的14.75倍,相对危险度(relative risk,RR ),(五)效应的估计,第三节 资料的整理与分析,RR与关联强度,相对危险度(relative risk,RR ),(五)效应的估计,第三节 资料的整理与分析,相对危险度(relative risk,RR ),RR95%CI,Woolf法,ln,RR的95%CI,ln,反自然对数即为RR95%CI,(五)效应的估计,第三节 资料的整理与分析,归因危险度 (attributable risk, AR ),a,c,意义E与 人群比较,所增加的疾病发生数量AR 值 暴露因素消
18、除后在暴露人群中所减少的疾病数量,(五)效应的估计,第三节 资料的整理与分析,RR 与AR 的比较,(1/10万人年),意义RR 吸烟对肺癌的病因学意义较大AR 戒烟对心血管疾病的预防作用较大 即公共卫生意义较大,归因危险度百分比AR %(病因分值EF),(五)效应的估计,第三节 资料的整理与分析,RR,意义 暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比,人群归因危险度 (population attributable risk, PAR ),(五)效应的估计,第三节 资料的整理与分析,PAR= ItI0,It:总人群率Io:非暴露组率,意义暴露导致一般人群所增加的疾病发生率
19、的大小PAR 值 暴露因素消除后在总人群中所减少的疾病数量,人群归因危险度百分比 PAR %,(五)效应的估计,第三节 资料的整理与分析,或,Pe:总人群的暴露比例,意义 PAR占总人群全部发病(或死亡)的百分比,(五)效应的估计,第三节 资料的整理与分析,已知Ie=75.25 , I0=5.10,全人群的PHCC死亡率It=16.25,则: AR=70.15 , AR%=93.2% PAR= 11.15, PAR%= 68.6% 从计算结果可知,虽然HBV导致PHCC的AR%93.2%,但因人群中只有部分人感染了HBV,故其PAR%仅为68.6%。,实例,剂量反应关系分析方法列出不同暴露水平
20、下的发病率以最低暴露水平组为对照,计算各暴露水平的RR和危险度差(RD)必要时,应对率的变化作率的趋势性检验,(五)效应的估计,第三节 资料的整理与分析,(五)效应的估计,第三节 资料的整理与分析,结果,血清胆固醇水平 患冠心病的RR 说明存在剂量效应关系,第四节 常见偏倚及其控制,偏倚,选择偏倚 信息偏倚 混杂偏倚,研究人群在一些重要因素方面与一般人群或待研究的总体人群存在差异,而导致研究结果的偏倚。,(一)选择偏倚(selection bias),第四节 常见偏倚及其控制,产生原因选择对象的方法不当最初选定参加研究的对象中有人拒绝参加或失访历史性队列研究中部分档案丢失或记录不全志愿者队列研
21、究开始时未能发现早期病人等控 制预防为主,抽样方法正确,严格按规定标准选择对象,(一)选择偏倚(selection bias),第四节 常见偏倚及其控制,研究对象因迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列所引起的偏倚。本质上属于选择性偏倚。,失访偏倚(lost to follow-up ),第四节 常见偏倚及其控制,控 制设计 选择便于随访的人群 在计算的研究样本的基础上扩大10% 实施 加强对随访员的管理 制定随访计划和监测措施 期中分析 整理资料 对于有缺项或漏项的对象进行补查,失访偏倚(lost to follow-up ),第四节 常见偏倚及其控制,在获取暴露、结局或其他
22、信息时所出现的系统误差或偏差。产生原因疾病、暴露标准不明确检验仪器不精确、检验技术不熟询问技巧不佳、记录错误,造假等,(二)信息偏倚(information bias),第四节 常见偏倚及其控制,控 制提高临床诊断技术、明确各项标准选择精确稳定的测量方法事前调准仪器严格实验操作规程同等对待每个研究对象培训调查员,提高技巧,统一标准,(二)信息偏倚(information bias),第四节 常见偏倚及其控制,与所研究因素和结果均有联系的第三因素在暴露组与对照组的分布不均衡,混淆了研究因素和结果间的真实联系。控 制设计阶段限制研究对象,匹配分析阶段分层分析、标准化或多因素分析,(三)混杂偏倚(c
23、onfounding bias),第四节 常见偏倚及其控制,第五节 优缺点及其他实践类型,直接获得暴露组和非暴露组的发病率或死亡率直接估计危险度符合时间顺序,验证病因的能力较强获得一种暴露与多种结局的关系收集的资料完整可靠,不存在回忆偏倚可研究疾病的自然史,(一)优 点,第五节 优缺点及其他实践类型,不适于发病率很低的疾病的病因研究 易发生失访偏倚 耗时,耗人力、物力、财力 设计要求严密,资料的收集和分析难度较大 随访过程中,已知变量的变化或未知变量的引入增加分析难度,(二)局限性,第五节 优缺点及其他实践类型,在充分考虑队列研究的优点,克服其局限性的基础上,在流行病学实践中,提出和实施了下列
24、改良类型:基于一个综合队列的队列研究基于大数据的队列研究,(三)其他类型,第五节 优缺点及其他实践类型,第五节 优缺点及其他实践类型,(三)其他类型,基于一个综合队列的队列研究 在研究开始时不按某一暴露因素选择对象,而是选择一定范围内符合某种条件的全部人群组成一个综合队列,收集队列人群的基线资料前瞻性观察各种可疑因素暴露的变化及多种健康结局的发生资料整理分析时,按队列成员在研究开始时对某种可疑因素的暴露情况分为不同的暴露组和对照组进行分析该类研究,虽然在研究开始时没有选择一个特异的研究(暴露)因素,并根据该因素组;但在资料分析时还是按暴露因素有无而分组的,第五节 优缺点及其他实践类型,(三)其
25、他类型,基于一个综合队列的队列研究 该类研究是前瞻性的,是从因求果的,暴露也是自然发生的,因而,本质上还是队列研究一个如此设计的综合队列研究可理解为多个队列研究的综合体适合于对某一类疾病进行综合病因研究,特别是当病因还不十分明确时,各种疾病可能有一些共同病因或复杂关系时更适用这种设计非常适合于研究多因多病的关系,能降低单个研究的成本,提高了研究效率,有效地克服了传统队列研究的某些局限性。,第五节 优缺点及其他实践类型,(三)其他类型,2. 基于大数据的队列研究基本的思路是:先提出研究问题(如肥胖与高血压的关系)从大数据中找出暴露组和对照组(如10年前血压正常有肥胖者为暴露组,同期血压和体重均正常者为对照组)查阅两组人群目前的结局(血压)信息分析暴露与结局的关系这种研究本质上是以大数据为基础的历史性队列研究。,队列研究的基本原理是什么?队列研究与病例对照研究比较有何异同?与实验性研究比较有何异同?队列研究的主要用途是什么?队列研究中的“暴露”包括哪些?,思考题,
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。