1、流行病学,陈维清 中山大学,第十八章 循证医学与系统综述(Evidence-Based Medicine and Meta-analysis),目录,第一节:循证医学,第二节:系统综述,01,02,重点难点,循证医学的概念 循证医学实践的基础 循证医学实践的方法 系统综述与meta分析的概念 系统综述与meta分析的步骤和方法,第一节 循证医学,1. 循证医学的产生(1)19世纪法国流行病学学家Pierre Louis指出:应用医学的“系统性规律”来对观察结果做出结论,为循证医学思想的形成奠定了基础。(2)20世纪70年代,英国流行病学家阿奇科克伦(Archie Cochrane)提出:医学界
2、应系统地总结和传播随机对照试验的研究证据,并将之应用于指导医学实践,提高医疗卫生服务的质量和效率。(3)1989年伊恩查默斯(Iain Chalmers)领导下研究的结果发现226种措施中,50%是没有随机对照试验的证据,在随机对照试验证据的措施中,40%有效,60%无效甚至有害。至此,循证医学的思想萌芽开始形成。,(一)概述,第一节 循证医学,(4)1992年加拿大McMaster大学以Dr. David L. Sackett等临床流行病学学者在美国医学会杂志发表了一篇题名为“循证医学(evidence-based medicine,EBM):医学实践教学新模式”的文章,第一次在重要医学文献
3、里提出了循证医学的概念,循证医学从此诞生。(5)1993年建立世界考科蓝协助组织(The Cochrane Collaboration),广泛收集临床随机对照试验的研究结果,在严格质量评价的基础上,进行系统评价(systematic review)以及荟萃分析(meta-analysis),将有价值的研究结果推荐给临床医生以及相关专业的实践者,以帮助实践循证医学。(6)1995年Dr. Sackett受聘于英国牛津大学循证医学中心主任。(7)自1999年起,英国医学杂志整理编辑并出版了Clinical Evidence集,每年二期并公开发行,以推荐临床医生应用于临床医疗实践。,第一节 循证医学
4、,2. 循证医学的定义 (1)循证医学是有意识地、明确地、审慎地利用现有最好的证据制定关于个体病人的诊治方案(David Sackett & Muir Gray, 1996)。(2)循证医学是最佳的证据、临床经验和病人价值的有机结合(David Sackett,2000)。,第一节 循证医学,循证医学定义的解读现有的最好证据指来自临床应用型研究的结果,有关效果的最好可能证据来自随机对照试验产生的结果。医生个人的临床经验,即医生通过临床实践获得的处理临床问题的能力。患者的价值观,即患者的爱好、兴趣和期望等。如能将三部分有机结合,促使医生和患者结合,形成诊断和治疗的联合体,将会使临床治疗的结局和患
5、者的生命质量达到最大化。,第一节 循证医学,3. 循证医学理念的拓展 (1)早期的循证医学是一种以治疗病人为目的,不断获得有关重要的诊断、预后、治疗、病因及其他相关健康信息的自我学习实践活动。所以,早期的循证医学应叫做循证临床实践(evidence-based clinical practice)。(2)1997年缪尔格雷的循证医疗卫生决策(Evidence-Based Healthcare):循证政策 (evidence-based policy)、循证采购(evidence-based purchasing)、 循证管理(evidence-based management)等。,第一节 循
6、证医学,1. 最佳的研究证据(1)就干预措施效果而言,最可靠的证据是来自多个随机对照试验的系统综述,其次是单个随机对照试验。(2)非基于研究证据的个人意见、依据病理生理知识的推理、以及动物实验和离体实验室研究的结果,可作为决策参考,但它们不属于以人群为研究对象的流行病学研究证据,与临床决策无直接的相关性。,(二)循证医学实践的基础,第一节 循证医学,第一节 循证医学,证据质量分级的重要意义研究质量的高低是结果可信性的前提,证据质量越高,结果的可信性就越高,决策成功的把握就越大。进行循证实践时,文献检索必须从可能的最高质量的证据开始。当面对各种质量的证据时,实践和决策应基于最好的证据。,第一节
7、循证医学,影响医学决策的三个要素医学决策必须兼顾和平衡证据、资源和价值取向三个方面,依据实际情况,做出合理的决定。,第一节 循证医学,医学决策三要素,2. 高素质的临床医生(1)医生的水平,包括医学理论知识、临床经验殊为重要。(2)临床医生必须掌握寻找证据、评价证据、应用证据的技能,不断更新和丰富自己新理论和新方法,把临床经验与最好的证据相结合,这样才能科学决策。(3)必须具备崇高的医德和全心全意为病人服务的精神。,第一节 循证医学,第一节 循证医学,3. 临床流行病学的基础知识和基本方法(1)要求医生能够鉴别研究设计的科学合理性(2)掌握严格地评价文献质量的学术标准(3)分析医学文献所报道研
8、究结果的真实性和可靠性(4)评价医学文献的临床重要意义和研究证据(成果)的卫生经济学意义,第一节 循证医学,4. 患者的参与(1)医生的任何诊治决策的实施,都必须通过病人的接受和合作,才会取得相应的效果,因此医患间的平等友好合作关系和医生诊治决策的正确与否,是成功实践循证医学的又一关键环节。(2)循证医学实践,要求医生能充分地关心与爱护病人,尊重病人的正当权益,要与病人友好合作,这样才可能保证有效的诊治措施取得病人的高度依从性,产生最佳效果,从而使病人获得最大的好处或利益,实现临床经验和病人价值的有机结合。,第一节 循证医学,循证医学实践的基础,提出一个临床实践问题寻找回答这一问题的最佳证据严
9、格评价证据应用最佳证据后效评价,(三)循证医学实践的方法,第一节 循证医学,1. 提出一个临床实践问题 把所需要的有关疾病的预防、诊断、治疗、预后和因果关系的信息转化为一个可以回答的问题。对一位有乳腺癌家族史的绝经期妇女,是否可以采用雌激素替代疗法治疗骨质疏松?如果采用,治疗的效果和发生乳腺癌的危险孰大孰小?宫颈癌对妇女的健康和生命产生严重威胁,是否需要对40岁及以上的妇女进行年度例行宫颈涂片检查,这种筛检计划的成本-效果如何,能否制定相应的政策,在社区人群中实施这项筛检?,第一节 循证医学,2. 寻找回答这一问题的最佳证据 循证医学实践强调要获得“最佳证据”,这些信息可以来源于经同行评估的、
10、高质量期刊上面发表的原始研究论著,亦可以来自经系统综述(systematic review)的各种出版物,如循证教科书、与证据相关的数据库、循证杂志和在线服务等。,第一节 循证医学,证据提供模式演进的5-S系统,3. 严格评价证据 由于研究质量参差不齐,内容丰富多彩,因此对文献的真实性和用途进行严格评价十分必要。阅读文献时应考虑下述问题:研究结果正确吗?结果是多少?将研究结果外推到全人群的把握度有多大?干预措施的好处(有效性、安全性和可接受性)是否大于坏处?研究结果适用于本地区的人群或卫生服务吗?,第一节 循证医学,4. 应用最佳证据临床医生可以在自己的临床实践中,直接地利用那些真实有效的证据
11、为病人服务,更有意义的方式是将这些证据在各级查房或小组讨论中提出,供其他医生学习借鉴。卫生保健工作者也应当利用评价后的最好证据制定决策,进行采购和管理卫生服务,然后改变资金流向和实现卫生资源的有效配置。,第一节 循证医学,5. 后效评价通过对应用当前最佳证据指导解决具体问题的效果进行评价,若成功,则可用于指导进一步实践。如不成功,则应具体分析原因,找出问题,再针对问题进行新的循证研究和实践,达到提高认识、促进学术水平和提高医疗质量的目的。,第一节 循证医学,第二节 系统综述,系统综述(systematic review,SR):是应用一定的标准化方法,针对某一特定问题的相关研究报告进行全面、系
12、统的收集,并对它们鉴定、选择和严格评价,从符合纳入标准的研究报告中提取相关资料,做整合性分析,最终得出综合性的结论。,(一)基本概念,第二节 系统综述,它属于对研究文献的二次研究。系统综述的目的,就是为循证医学提供最好的证据。当纳入的是一种类型的研究时,各研究之间具有同质性,可采用统计学的方法对资料进行定量综合,即进行meta分析。如纳入的研究没有同质性,不能对资料进行meta分析,但可对资料进行定性综合。,第二节 系统综述,系统综述与传统综述的比较,第二节 系统综述,一个好的系统综述应具备以下特征有清晰的题目和明确的目的采用综合、全面的检索策略检索文献研究入选和排除标准明确列出了所有入选研究
13、清楚地表达每个入选研究的特点,并对这些研究的方法学质量进行了评价阐明了所有排除研究的原因如果可能,使用meta分析合并合格研究的结果如果可能,对合成的结果进行敏感性分析和亚组分析采用统一的格式报告研究结果,选题和制定研究方案检索和收集原始文献根据入选标准选择合格的研究评估纳入研究的质量提取信息、填写摘录表、建立数据库资料汇总结果总结报告,(二)步骤和方法,第二节 系统综述,1. 选题和制定研究方案(1)选题选题的基本原则是选择比较重要的临床或公共卫生问题,而且目前尚无肯定结论。研究问题要宽窄适宜,研究目的明确。可以采用PICO格式将研究问题结构化,即对研究对象(participants)的特征
14、、干预措施(intervention)、与什么进行比较(comparison)和观察结局指标(outcome)进行定义,从而将不易定位的选题用标准化的方式表述出来,使选题精细、目的明确。,第二节 系统综述,第二节 系统综述,如何构建一个研究问题,(2)制定研究方案本次系统综述或meta分析的背景,即选题或立题的依据系统综述的目的纳入原始研究的标准检索策略系统综述的方法:选择、评价、收集数据、结果分析其他:封面、致谢、利益冲突、参考文献时间安排、人员、经费和结果传播等,第二节 系统综述,2. 检索和收集原始文献(1)制定综合检索策略:根据研究问题确定检索词,将检索词进行不同组合形成检索策略。 以
15、“慢性肾病患者服用长链多不饱和脂肪酸(n-3 LCPULA)预防或延缓肾病进展是否优于安慰剂对照?”为例干预措施:多不饱和脂肪酸的各种可能词汇疾病:即慢性肾病的各种可能词汇,第二节 系统综述,研究方法:RCT等上述每组词汇内部以逻辑符“OR”相连,三组词汇之间则以逻辑符“AND” 相连,从而构成检索策略。(2)文献来源资料收集的原则是多途径、多渠道、最大限度地收集相关文献。通常要检索多种电子资源数据库,并辅以参考文献的追溯、手工检索等。,第二节 系统综述,第二节 系统综述,系统综述常用的电子资源数据库,3. 根据入选标准选择合格的研究确定入选和排除标准:即对P、I、C、O四个要素以及研究类型做
16、明确的界定以“慢性肾病患者服用长链多不饱和脂肪酸(n-3 LCPULA)预防或延缓肾病进展是否优于安慰剂对照?”为例,入选标准:RCT;使用n-3 LCPUFAs,包括EPA和(或)DHA或鱼油作为干预措施;安慰剂作为对照;报告了肾功能的结果。排除器官移植和终末期肾病患者。,第二节 系统综述,3. 根据入选标准选择合格的研究通过阅读题目、摘要排除不相关的、重复发表的、综述类等文章通过阅读全文排除不符合纳入标准的文章对信息不全面的文章,应尽可能与作者联系,获取相关资料要求至少有2名评价者独立选择,出现分歧要进行讨论或由研究负责人仲裁,第二节 系统综述,4. 评估入选研究的质量质量评估包括对研究的
17、内部真实性和外部真实性进行评价对随机对照试验的方法学质量评估受试者分组是否真正随机随机方案是否隐藏是否详细说明入选标准组间基线是否可比研究过程中是否使用了盲法对失访、退出及不良反应病例是否进行了详细记录,是否报告失访原因是否采用意向分析(intention to treat analysis, ITT)法分析结果患者的依从性如何,第二节 系统综述,第二节 系统综述,RCT质量评价的Jadad评分,Cochrane 偏倚风险评估工具中偏倚风险的评估准则,第二节 系统综述,Cochrane 偏倚风险评估工具中偏倚风险的评估准则,第二节 系统综述,5. 提取信息,填写摘录表,建立数据库确定研究身份的
18、信息,如第一作者、发表的杂志和年份等决定结果适用范围和亚组分析的PICO数据确定研究真实性的方法学信息meta分析所需的信息,如效应估计值及其标准误、研究的样本量以及四格表中每个格中的例数等,第二节 系统综述,第二节 系统综述,Meta分析所需的信息提取表(以随机对照试验为例),第二节 系统综述,6. 汇总结果定性分析(qualitative synthesis):是叙述性合成证据的方法,即通过表格对合格研究的研究特征(如研究设计、研究对象、研究结局、研究质量等)与研究结果进行结构化的比较和总结,定性评价研究结果在不同研究特征上是否相似(即研究结果是否与某些研究特征有关)。定量分析(quant
19、itative synthesis):就是用统计学方法汇总研究结果,涉及异质性检验、meta分析、敏感性分析和亚组分析等内容。,第二节 系统综述,(1)异质性检验(heterogeneity test)是对统计量的齐性检验,目的是检查各个独立研究的结果是否存在异质性。如果不存在异质性,说明这些独立研究的真实效应可能相同,具有可合并性。造成异质性的原因临床异质性:如对象特征、诊断、干预、对照、研究地点、评价结局等不同方法学异质性:研究设计的质量不同统计学异质性:不同试验观察得到的效应变异性超过了机遇(随机误差)本身所致的变异性,第二节 系统综述,第二节 系统综述,若Q,,则 P,,则 P,,则
20、P,表明研究间存在异质性,异质性的大小也可用I2来定量衡量I2是定量衡量异质性大小的指标,表示由于异质性而不是抽样误差(机会)导致的效应占总效应估计值的百分率当I2=0时,表明没有观察到研究间的异质性I2值大于50时,可以认为有明显的异质性如果各研究间无统计学异质性(P0.1,I250%),采用固定效应模型若存在异质性(P0.1,I250%)时,但合并资料仍然具有临床上的意义,则采用随机效应模型进行合并分析,并谨慎解释研究结果,第二节 系统综述,(2)meta分析(meta-analysis)就是对某一研究问题的多项独立研究的结果进行收集、合并及统计分析的一种方法,通过该方法以获得能够代表这些
21、研究的平均水平。目的提高统计效能提高对效应值的估计精度评价文献中各研究结果的一致性发现某些单个研究未阐明的问题探讨现有文献发表偏倚的程度提出新的研究问题,第二节 系统综述,原则所要综合的原始研究所探索的研究问题必须相同合并结果时必须纳入所有有关的研究假设所有纳入的研究都没有偏倚利用加权平均法对真实值进行定量估计,第二节 系统综述,第二节 系统综述,Meta分析中的效应指标及统计模型选择,(3)敏感性分析和亚组分析敏感性分析(sensitivity analysis):是检查一定假设条件下所获结果的稳定性的方法目的:发现影响meta分析研究结果的主要因素方法:分层分析,即按不同研究特征,如不同的
22、统计方法(固定效应或随机效应模型)、研究的方法学的质量高低、样本量大小、是否包括未发表的研究等,第二节 系统综述,亚组分析(subgroup analysis):是指针对不同研究特征进行资料的分析目的:探讨临床异质性的来源,即识别效应修饰因素或评价交互作用方法:将研究对象根据年龄、性别、病情轻重,干预措施不同的剂量或疗程等进行比较,第二节 系统综述,第二节 系统综述,7. 总结报告对入选文献的基本情况加以描述以例如发表在药物流行病学杂志 2016 年第 10 期“雾化吸入双黄连注射剂治疗上呼吸道感染效果的 meta 分析” 为例:通过检索中国知网、万方数据库和维普网分别获得 篇、 篇、 篇文献
23、,三个数据库合并后,剔除重复文献,筛选出文献共计 篇。 通过进一步查阅题目和摘要排除明显不相关文献后获得 篇文献。 最后通过阅读全文最终纳入 篇文献,合计 例上呼吸道感染的患者,其中观察组 例,对照组 。 文献检索流程及结果见图 ,纳入研究的一般特征。,第二节 系统综述,文献检索流程及结果,第二节 系统综述,8篇关于孕妇被动吸烟与小于胎龄儿关系的文献,第二节 系统综述,使用直观森林图(forest plots)表示meta分析的结果,第二节 系统综述,2009年国际上提出的系统综述和meta分析优先报告的条目(preferred reporting items for systematic r
24、eviews and meta-analyses,PRISMA),简称PRISMA声明进行总结报告27个条目清单四阶段的流程图,第二节 系统综述,第二节 系统综述,第二节 系统综述,第二节 系统综述,(三)偏倚,第二节 系统综述,1. 偏倚的来源与控制系统综述的偏倚也可分为信息偏倚、选择偏倚和混杂偏倚系统综述的三种偏倚存在于两个层面,即原始研究固有存在的,以及系统综 述制作过程中引入的新的偏倚,(1)信息偏倚来源:主要源于原始研究的集合数据,如果变量的定义不合理或不明确、数据提取的方式不正确、原始信息不准确、以及原始研究中有关信息缺失等。控制措施:需要在定义变量和提取数据上下工夫,必要时应和原
25、作者取得联系,核实可疑的信息或索取缺如的信息。(2)选择偏倚来源:纳入和排除标准不当或不明确、文献检索策略和方法不当、发表偏倚、语言偏倚(language bias)、地区偏倚(geographical bias),以及根据结果人为地纳入或排除个别研究等。控制措施:制定明确的纳入和排除标准、制定系统严密的文献检索计划。,第二节 系统综述,(3)混杂偏倚来源:来自于原始研究、不同组原始研究在其他可能影响效应估计因素的不可比性控制措施:尽可能地选用混杂作用较小的原始研究,第二节 系统综述,第二节 系统综述,2. 偏倚的种类发表偏倚(publication bias): 指具有统计学显著性意义的研究
26、结果较无显著性意义和无效的结果被报告和发表的可能性更大。文献检索偏倚(location bias): 指在文献检索中采用的检索策略或检索工具不具有代表性。语言偏倚(language bias)、文献库偏倚(database bias)。引用偏倚(citation bias):手工检索文献时,通过文章后面所列的参考文献可以进一步查找其他相关文章,这种途径可能带来引用偏倚,因为支持阳性结果的试验比不支持的试验可能更多的被作为参考文献加以引用。,第二节 系统综述,多次发表偏倚(multiple publication bias):同一研究多次发表会从几方面引入偏倚。有偏倚的入选标准(biased i
27、nclusion criteria):通常文献入选标准由熟悉所研究领域的调查者来制定,那么这个标准就可能受调查者知识的影响。权重偏倚(weighting bias): 在对各个研究结果进行整合时,由于使用不恰当的权重而引起的偏倚。,第二节 系统综述,3. 偏倚的检查 (1)漏斗图:是以研究的效应量估计值(如RR、OR、RD和死亡比或取其对数值等)作为横坐标,以效应量标准误的倒数作为纵坐标画出的散点图。,漏斗示意图,第二节 系统综述,(2)失安全数(Fail-safe N,Nfs) :以计算需多少阴性研究结果的报告才能使结论逆转来估计发表偏倚的程度。 失安全数越大,说明meta分析的结果越稳定,
28、发表偏倚对结果的影响越小,结论被推翻的可能性越小。,(四)质量评价,第二节 系统综述,荷兰和加拿大的专家在2007年制定的AMSTAR(a measurement tool to assess systematic reviews,AM-STAR)系统综述质量评价工具:从是否事先制定了研究方案、文献检索是否系统全面、文献筛选和数据提取是否可重复等11个方面对系统综述的实施过程和所采取的偏倚控制措施进行评价。,第二节 系统综述,AMSTAR评价清单与说明,第二节 系统综述,(五)系统综述与meta分析的进展,第二节 系统综述,快速综述(rapid review):是指对有关决策问题的现有证据进行
29、的快速总结和评估。系统综述的综述(overview of systematic reviews):对纳入现有的系统综述,而不是原始研究,其本质就是系统综述的综述。复合系统综述(multi-arm systematic review):是针对更为宽泛的研究问题的有关证据的综合,可以看成是一个包括多个独立的并列的系统综述的综述。,第二节 系统综述,累积meta分析(cumulative MA):就是把有共同研究目的研究结果看成一个动态的连续统一体,每当有新的研究完成后,即将新的研究结果及时纳入重新进行一次meta分析,然后再按一定的顺序排列累积的结果,并用森林图表示,以分析每次研究对综合结果的影响。个体病人资料的meta分析(individual patient data MA,IPD MA):又叫“pooling分析”,对原始研究数据的合成分析。前瞻性meta 分析( prospective MA,PMA) :是指在任何研究(通常为随机对照试验)的结果尚未出来之前,先进行系统检索、评价和制定纳入及排除标准的一种meta分析。网络meta分析(network meta-analysis):包括直接和间接比较两种数据,并可能同时对多种干预措施进行比较。多种干预措施效果之间的差异可用一个网状的图展示。,