1、课室调整,下一次统计理论课(林爱华老师)地点:101 (原401),1,2,观察性研究的设计与数据分析,顾 菁医学统计与流行病学系2015年8月,3,观察性研究 (observational study),定义: 在不对研究对象施加任何干预措施的情况下,通过观察或访问的方法,客观地记录被研究事物的状况,用于描述疾病或健康状况在人群中的分布,并探索暴露和疾病时间关系的一类方法。 由于没有干预措施,也被称为非实验研究(non- experimental study)。,4,伦敦宽街霍乱流行的地区分布,1854年秋季,伦敦宽街爆发霍乱,10天内死去500多人,在霍乱爆发后的6天内发病严重的街道有3/
2、4以上的居民离去。,5,当时霍乱病原体尚未发现,英国医师John. Snow集中精力调查发生疫情的地点和死亡病例,通过观察性流行病学调查方法,发现几乎所有的死亡病例都发生于离宽街水井不远的地方,且他们都饮用宽街供水站的水。Snow根据疾病分布进行分析,霍乱暴发与宽街供水站的水井有密切关系,而以后的研究进一步证实了这一假设。经封闭水井,爆发即告终止。,6,观察性研究特点,研究过程中没有人为施加干预措施,而是客观地观察记录现状及其相关特征,这里的研究因素(居住地、吸烟量、家族史)是客观存在的;混杂因素不能通过随机分组的方法来平衡,如拟了解和比较有、无肿瘤家族史对肿瘤病人预后的影响。,7,观察性研究
3、中可能存在很多混杂,一般认为该类研究所获得的证据质量较随机对照试验要低。然而,近些年越来越多的研究指出,设计良好的观察性研究能够提供干预效果的有用信息,证据的力度有时并不比随机对照试验差。,8,观察性研究种类,横断面研究(cross-sectional study)病例-对照研究(case-control study) 队列研究 (cohort study),9,研究类型与时间的关系,回顾性研究:病例对照研究,横断面研究,前瞻性研究:队列研究,时间,10,横断面研究Cross-sectional study,11,横断面研究,基本概念: 在特定时间点与特定范围内,以个人为单位收集并描述人群中的
4、有关变量(因素)以及疾病或健康状况的分布情况;并分析有关因素与疾病之间的关系。 又称现况调查(prevalence study)或患病率研究,12,13,14,15,16,17,横断面研究的目的与应用范围,掌握目标群体中疾病或健康状况的分布提供疾病病因研究的线索确定高危人群评价疾病监测、预防接种等防治措施的效果,18,横断面调查的类型普查(census)抽样调查(Sampling survey),19,普查(census),概念:在特定时点或时期、特定范围内(某一地区或具有某种特征)的全部人群均为研究对象的调查。,20,21,普查(census),早期发现、早期诊断和早期治疗某些疾病了解疾病和
5、健康状况的分布了解当地居民的健康水平了解人体各类生理生化指标的正常值范围,22,抽样调查(Sampling survey),概念: 通过随机抽样的方法,对特定时点、特定范围内人群的一个代表性样本进行调查,以样本的 统计量来估计总体参数所在范围。,23,抽样调查(Sampling survey),抽 样,样本 、 p,研究人群,目标人群,总体和,推 论,24,单纯随机抽样 (simple random sampling)系统抽样 (systematic sampling)整群抽样 (clustering sampling)分层抽样 (stratified sampling)多阶段抽样 (mult
6、istage sampling),常用抽样方法,25,1. 单纯随机抽样(simple random sampling)10,000200 ID. 0001 0002 0003 0004 10,000RND. 6169 4895 0307 1639 3298 先将调查总体的全部观察单位编号,再用随机数字表或抽签等方法随机抽取部分观察单位组成样本,每个单位被抽中的概率相等。,26,2 . 系统抽样 (systematic sampling) :又称等距抽样或机械抽样。先将总体的观察单位按某一顺序号等分成k个部分,再从第一部分随机抽取第n号观察单位,依次用相等间隔,机械地从每一部分各抽一个观察单位
7、组成样本。,27,总体例数为1000,样本例数为100,抽样间隔为10,先在1-10之间随机确定一个数字,比如为4,于是以职工工作证号4,14,24,34,994者组成样本。,欲了解某单位职工HBsAg阳性率,该单位有职工1000人,按系统抽样抽取一例数为100人的样本。,系统抽样,28,3.整群抽样 (clustering sampling),将总体分成若干群组,抽取其中部分群组作为观察单位组成样本,被抽到的群组中的全部个体均作为调查对象。,29,30,4. 分层抽样 (stratified sampling),将总体的单位按某种特征分为若干层,然后再从每一层内随机抽取一定数量的观察单位,合
8、起来组成一个样本。,31,5. 多阶段抽样 (multistage sampling),大型流行病学调查中结合使用上面几种抽样方法。常把抽样过程分为不同阶段: 即先从总体中抽取范围较大的单元,称为一级抽样单位(如省、直辖市), 再从每个抽得的一级单元中抽取范围较小的二级单元(县),这就是二级抽样; 依次再抽取范围更小的单元,这就是多级抽样。,32,1. 明确目的和设计类型2. 研究对象3. 抽样方法4. 样本含量5. 资料收集:疾病、暴露因素等资料。6. 偏倚与控制7. 资料分析,横断面调查的研究设计与实施,33,横断面调查的资料分析,描述研究对象的一般特征常用的指标:集中趋势和离散趋势指标的
9、均数、标准差;中位数、四分位数间距患病频率指标:患病率、感染率、抗体阳性率等,34,暴露因素与疾病关系分析,暴露是指研究对象接触过某种待研究的物质(如有毒物质)、具备某种待研究的特征(如年龄、性别)或行为(如吸烟),35,36,暴露因素与疾病关系分析,37,比值比 (odds ratio, OR),OR指暴露与疾病联系的强度。OR1 说明疾病的危险度因暴露而增加OR1 说明疾病的危险度因暴露而增加OR1 说明疾病的危险度因暴露而减少OR=1 说明疾病的发生与暴露与否无关,69,70,71,病例对照研究的常用统计分析方法,成组:卡方检验、非条件logistic回归(单因素、多因素)匹配:条件lo
10、gistic回归(单因素、多因素),72,病例对照研究的优点与局限性,一、优点1. 可用于对罕见病的研究2. 省时、省钱、省人力,并易于组织 3. 可以同时研究多个因素与某种疾病的联系,特别适合于探索性病因研究,73,二、局限性,对暴露比例低的疾病的因素,需样本太大易造成选择偏倚难以避免回忆偏倚难以判断暴露与疾病的时间先后,74,研究类型与时间的关系,前瞻性研究:队列研究,时间,75,3. 队列研究Cohort study,76,队列研究 cohort study,队列研究是将一个范围明确的人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局的差异,从而
11、判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究方法。,77,队列研究又称为前瞻性研究(prospective study)、发生率研究(incidence study)、随访研究(follow-up study)及纵向研究(longitudinal study)等,目前常用的名称是队列研究。,78,目标人群,没有出现研究结局有可能出现研究结局,时间,可 比,工作时序,队列研究的基本原理,79,80,81,82,83,队列研究的特点,属于观察法, 队列研究中的暴露是客观存在的。设立对照观察方向由“因”及“果”能确证暴露与疾病的关系可以计算疾病的发病率、累积发病率,84,结局指标的选
12、择,一次研究可以涉及多个结局;结局:发病、复发、死亡、健康状况的变化、生命质量的变化等定义明确,有统一标准并严格遵守,85,是指人群都在某一固定时间或一个短时期之内进入队列,之后对他们进行随访观察,直至观察期终止,成员没有无故退出,也不再加入新的成员,即保持队列的相对固定。,队列的分类,固定队列(fixed cohort),86,Fixed Cohort,Start,End,87,是相对固定队列而言的,即在某时期确定队列后,原有的队列成员可以不断退出,新的观察对象可以随时加入。,队列的分类,动态队列(dynamic population),88,Dynamic Cohort,Start,End
13、,89,随访队列示意图“I”进入队列;“x”无故退出队列;“0”出现终点结局,1990 2000 年选定队列 随访终止 开始观察,删失,90,率的计算,1. 累计发病率(死亡率):观察开始时的人口数作分母,以整个观察期内的发病(或死亡)人数为分子,计算某病的累积发病率,N:队列研究的总人数d:随访期内新发病例数p:累计发病率,91,如有删失(censoring),可用以下校正公式:N0:期初观察对象的数目c:观察期内中途删失的例数,92,2. 人时发病率计算,人时发病率(person-time incidence rate),又称发病密度(incidence density ID)。 P:人年
14、发病率 N:观察总人年数 d :观察期内发病人数,93,甲地 乙地,- -* - - -*- - - - - - - - -* - - -*- - - - - - - -死亡率: 2/4 2/4,2/3 2/3.5,94,95,96,队列研究中疾病与暴露关联的指标,1. 相对危险度(relative risk,RR) 描述暴露危险因素与疾病关联。,P1:暴露队列的发病率,P0:非暴露队列的发病率,97,RR:表明暴露组发病或死亡的危险是非暴露组的多少倍。RR值越大,表明暴露的效应越大,暴露与结局关联的强度越大。,98,99,队列研究中暴露与非暴露组差异(发病率)的比较方法:发病率的比较:Man
15、tel-Haenszel 卡方检验剂量-反应关系:趋势卡方检验多因素分析:Cox回归、Poisson回归等,100,病因研究中证据的强度,横断面研究病例对照研究队列研究随机对照研究RCT,弱,强,101,由于观察性研究不能通过随机分配均衡混杂因素,研究结果的真实性可能存在偏差。清晰、透明的研究报告有助于读者评价研究中潜在的偏倚和混杂。为规范观察性研究报告的质量,由流行病学家、统计学家、著名杂志主编及临床医生等组成的国际性合作小组制定了流行病学观察性研究报告规范STROBE(Strengthening the Reporting of Observational Studies in Epide
16、miology, STROBE),102,103,摘 要 “很多生物医学研究都是观察性的。但对这类研究的报告却通常不完整,从而限制了对其优缺点及普适性的评价。加强流行病学中观察性研究报告质量(STROBE) 工作组针对一篇完整明确的观察性研究报告应包括的内容提供了一套建议。建议涵盖了流行病学研究的三种主要设计类型:队列设计、病例对照设计和横断面设计。”,104,“2004 年 9 月,我们召开了为期 2 天的研讨会,与会的方法学专家、研究人员和期刊编辑共同起草了一份观察性研究报告应纳入的条目清单草案。此后,又通过协调小组数次会议及与有关人员电子邮件讨论等对该草案进行了修改,纳入了经验性证据和方
17、法学方面的意见。通过研讨会及之后反复的咨询和修订,我们制定出了一个包含 22 个条目的清单( STROBE 声明),分为论文的题目、摘要、引言、方法、结果和讨论等部分。”,105,“详细的解释和示范文件已另行发表,在 公共科学图书馆一医学 (PLoS Medicine )、 内科学年报 ( Annals of Internal Medicine )和 流行病学 (Epidemiology )的网站可以免费获得。我们希望 STROBE 声明能有助于改善观察性研究报告的质量。”,106,107,108,109,110,小 结,观察性研究和干预性研究的最主要区别?横断面研究的特点、常用的抽样方法、常用的统计分析方法病例对照研究特点、病例和对照的选择、常用的统计分析方法队列研究的特点、发病率的计算如何设计、实施和报告观察性研究?-STORBE,111,谢 谢,