观察性研究中的因果推断方法三30分钟.ppt

上传人:h**** 文档编号:177161 上传时间:2018-07-14 格式:PPT 页数:51 大小:7.62MB
下载 相关 举报
观察性研究中的因果推断方法三30分钟.ppt_第1页
第1页 / 共51页
观察性研究中的因果推断方法三30分钟.ppt_第2页
第2页 / 共51页
观察性研究中的因果推断方法三30分钟.ppt_第3页
第3页 / 共51页
观察性研究中的因果推断方法三30分钟.ppt_第4页
第4页 / 共51页
观察性研究中的因果推断方法三30分钟.ppt_第5页
第5页 / 共51页
点击查看更多>>
资源描述

1、2016.07.27(天津),Fuzhong Xue (薛付忠)山东大学 公共卫生学院 生物统计学系Department of Biostatistics, School of Public HealthShandong University,中国生物统计2016年学术年会导师讲坛(天津),观察性研究中的因果推断方法(三)(30分钟),观察性研究中的偏倚及控制策略,-in the Perspective of Causal diagram,2,Outline,3,Statistical Association,偏倚及其来源,4,Definitions of bias,偏倚及其来源,5,Defi

2、nitions of bias,偏倚及其来源,6,The soureces of biases,选择偏倚,信息偏倚,混杂偏倚,偏倚及其来源,7,选择偏倚( selection bias )及其控制,选择偏倚:是由于选入的研究对象与未选入的研究对象在某些特征上存在差异而引起的误差;这种偏倚常发生于研究的设计阶段,是指不同类型(暴露或结局的特征)的研究对象入选的机会不同。 选择偏倚包括:包括入院率偏倚(Berkson偏倚)、现患病例-新发病例偏倚(Neyman偏倚)、检出征候偏倚、无应答偏倚、时间效应偏倚等等类型。,选择偏倚及其控制,Selection bias can cause an over

3、estimate or underestimate of the association.,8,选择偏倚( selection bias )的来源,选择偏倚及其控制,Selection bias can occur in several ways:Selection of a comparison group (controls) that is not representative of the population that produced the cases in a case-control study. (Control selection bias) Differential l

4、oss to follow up in a cohort study, such that the likelihood of being lost to follow up is related to outcome status and exposure status. (Loss to follow-up bias) Refusal, non-response, or agreement to participate that is related to the exposure and disease (Self-selection bias) Using the general po

5、pulation as a comparison group for an occupational cohort study (Healthy worker effect) Differential referral or diagnosis of subjects,9,选择偏倚及其控制,比较组(G1,G2)存在很高的选择效应,由于对E S D中S施加条件(选择),开放了偏倚路E.D。其后果是被选择样本的效应(RR1)与未入选样本的效应(RR0)不等(RR1 RR0 ),RR1缺乏总体人群(RRP)的代表性。 选择偏倚的特点: 1)难以通过调整而消除其影响。 2)需要在设计阶段消除。 3)影

6、响E D的因果推断。,选择偏倚的因果图模型,10,选择偏倚( selection bias ),举例:在HIV阳性者中,怀孕是否影响到发展为艾滋病的进程的观察性研究中,研究者希望知道新怀孕对HIV阳性者发展为艾滋病的时间效应。如果该研究在产前保健诊所进行,则怀孕和新诊断为艾滋病这二个事件均可影响去诊所就诊的几率(新怀孕者更易于就诊,而诊断为艾滋病者也影响就诊机会),这样证明怀孕与发展为艾滋病之间关系就会收到选择偏倚的影响。,选择偏倚及其控制,11,选择偏倚及其控制,12,信息偏倚( Information bias ),信息偏倚:又称观察偏倚、错误分类偏倚或测量偏倚,是由于测量(疾病、暴露)不

7、准确,诊断标准不明确以及原始记录不完整等原因所造成的偏倚。包括:(1)回忆偏倚:由于研究对象不能准确、完整地回忆以往发生的事情和经历时所产生的差异。(2)报告偏倚:由于研究对象有意扩大或缩小某些信息造成的偏倚。它与回忆偏倚是不同的。(3)诊断怀疑偏倚:由于研究者和被研究者事先了解被研究者的暴露或分组情况,怀疑被研究者已经患病,或希望出现阳性结果,因而在诊断或分析时做出带倾向性的判断而造成的偏倚。(4)暴露怀疑偏倚:研究者事先了解研究对象的患病情况或结局,可能会对其使用与对照组不可比的方法探寻认为与某病或结局有关的因素,而对同一组研究对象以不同的方法调查。这样,结果会出现很大差异。(5)测量偏倚

8、:是指对研究所需指标或数据进行测量时产生的偏倚。,信息偏倚及其控制,13,信息偏倚及其控制,信息偏倚( Information bias )回忆偏倚,14,Correct Classification VS. Misclassification(错分偏倚),信息偏倚及其控制,15,信息偏倚及其控制,信息偏倚及其控制,信息偏倚的因果图模型,信息偏倚及其控制,信息偏倚的因果图模型,信息偏倚及其控制,信息偏倚的因果图模型,信息偏倚及其控制,信息偏倚的因果图模型,20,混杂偏倚( confounding bias ),混杂因子亦称混杂因素或外来因素,是指与研究因素和研究结局均有关,若在比较的人群组中分

9、布不匀,可以歪曲(掩盖或夸大)因素暴露与结局之间真正联系的因素。基本特点是: 必须是所研究结局的独立危险因子; 必须与研究因素(暴露因素)有关; 一定不是研究因素与研究结局(疾病)因果链上的中间变量。具备这几个条件的因素,如果在比较的人群组中分布不均,即可导致混杂偏倚产生。,例如,人群中观察到肺癌患者往往指甲发黄,研究假设为:黄指甲是肺癌的危险因素? 此时,吸烟就是研究假设的一个混杂因素。,混杂偏倚及其控制,控制混杂偏倚的基本方法设计阶段:,21,随机化分配( Randomization ),混杂偏倚及其控制,控制混杂偏倚的基本方法设计阶段:,22,随机化分配有效范围,E,混杂偏倚及其控制,2

10、3,Qi Y, Fan J, Liu J, Wang W, Wang M, Sun J, Liu J, Xie W, Zhao F, Li Y, Zhao D.Cholesterol-overloaded HDL particles are independently associated with progression of carotid atherosclerosis in a cardiovascular disease-free population: a community-based cohort study.J Am Coll Cardiol. 2015 Feb 3;65(4

11、):355-63.,升高血清HDL的药物(CETP),控制混杂偏倚的基本方法设计阶段:,随机化分配理解病理生理机制的重要性,混杂偏倚及其控制,控制混杂偏倚的基本方法设计阶段:,24,随机化分配理解病理生理机制的重要性,混杂偏倚及其控制,控制混杂偏倚的基本方法设计阶段:,25,限制( Restriction ),研究受教育水平对记忆力的影响时,儿童认知能力是一个混杂因子,此时可以选择认知能力相同的儿童,此时由于将混杂限制在了固定水平,从而实现对其控制。,(C),(E),(D),选择认知能力相同的儿童,(C),(E),(D),S,混杂偏倚及其控制,L和E通过两条路LSE和LE而有向相连(d-con

12、nected), 然而,在配对设计中L与E是相互独立的。在LSE中,由于对S施加条件而导致L与E相关,但方向与 LE的相关相反而相互抵消,保证L与E在匹配亚队列中仍独立。因而,匹配并未产生混杂,不必要调整。,26,控制混杂偏倚的基本方法设计阶段:,匹配( Matching )在队列设计中匹配,引自: Mansournia MA. Int J Epidemiol. 2013;42(3):860-9.,混杂偏倚及其控制,右图是匹配混杂因子C的匹配病例对照设计。C对D的作用通过C D、C E D、C.D(是有C S D形成的碰撞偏倚路)而有向连接。匹配混杂因子C后,C在病例组与对照组间相等,故C与D

13、独立,意味着C D、C E D、C.D三条路的关联性之和必定为零。则, C D与 C.D的关联性之和必定不为零;因此,混杂路E C D仍然开放。所以,匹配并不能消除C的混杂作用。不仅如此,由于对C S D中碰撞节点S施加条件(匹配),还额外引入了碰撞偏倚C.D。,27,引自: Shahar E. Clin Epidemiol. 2012;4:137-44,控制混杂偏倚的基本方法设计阶段:,匹配( Matching )在病例对照设计中匹配,混杂偏倚及其控制,28,Relative Risk = (27/75) / (14/81) = 2.1,Smokers,Non-smokers,Relativ

14、e Risk = (1/25) / (2/50) = 1.0,Relative Risk = (26/50) / (12/31) = 1.3,控制混杂偏倚的基本方法分析阶段:,分层分析( Stratified analysis ),化学物暴露,吸烟,恶性肿瘤,?,混杂偏倚及其控制,U,3,(参考文献: Shahar E. Clin Epidemiol. 2012;4:137-44. ),29,控制混杂偏倚的基本方法分析阶段:,更受青睐的控制方法,混杂偏倚及其控制,为了消除混杂L对推断暴露(A) 结局(Y)的因果效应的影响,采用逆处理概率加权 (IPTW)法,对样本中每个个体进行加权,以构造出阻

15、断混杂路LA后的准样本人群(Pseudopopulation),然后在准样本人群中采用边际回归模型推断A Y。IPTW计算方法为: 当 时,则个体i的权重为:当 时,则个体i的权重为:在纵向设计条件下,稳定(stable)的IPIW计算方法为:,D Marginal Structral Model,Robins JM. Epidemiology. 2000;11(5):550-60.,横断面设计(基线),纵向设计(随访),Inverse-probability-of-treatment weights (IPTW),30,控制混杂偏倚的基本方法分析阶段:,混杂偏倚及其控制,基于准样本人群,用各

16、种边际回归模型(logistic回归模型,Cox回归模型、广义估计方程、联合模型等均可作为边际回归模型),估计A Y的因果效应。例如,采用logistic回归的边际结构回归模型为: 推荐文献及SAS程序: Douglas Faries, etal. Analysis of Observational Health Care Data Using SAS. SAS Institute,2010,D Marginal Structral Model,Robins JM. Epidemiology. 2000;11(5):550-60.,横断面设计(基线),纵向设计(随访),Inverse-prob

17、ability-of-treatment weights (IPTW),31,控制混杂偏倚的基本方法分析阶段:,混杂偏倚及其控制,32,控制混杂偏倚的基本方法分析阶段:,混杂偏倚及其控制,33,An example: Statins, Cholesterol, and Colorectal Cancer,Mamtani R, et al. Disentangling the Association between Statins, Cholesterol, and Colorectal Cancer: A Nested Case-Control Study. PLOS Medicine, Ap

18、ril 26, 2016,混杂偏倚控制方法的正确应用,普遍存在的表2谬误,在人群观察性研究的医学论文中,通常用两个表报道研究结果。 1)在表1中,通常描述和比较暴露组与对照组(或病例组与对照组)人群的人口学、社会经济、临床特征。 2)在表2中,通常报告多元回归模型(如多元线性回归、Logistic 回归、Cox回归等)调整协变量后的关联分析结果,展示主要变量在调整了次要变量后对结局的影响。,34,Westreich D, Greenland S. Am J Epidemiol. 2013;177(4):292-8.,条件logistic 回归模型:,混杂偏倚控制方法的正确应用,35,An ex

19、ample: Statins, Cholesterol, and Colorectal Cancer,Association between Hyperlipidemia and Colorectal Cancer,Mamtani R, et al. PLOS Medicine, April 26, 2016,混杂偏倚控制方法的正确应用,36,An example: Statins, Cholesterol, and Colorectal Cancer,Association between Hyperlipidemia and Colorectal Cancer,ORs for associ

20、ation between colorectal cancer risk and total cholesterol measured at different time intervals before colorectal cancerdiagnosis, among statin nonusers (n = 15,052 cases; n = 46,043 controls). Adjusted for obesity (BMI 30 kg/m2), ever smoking, chronic use of aspirin or NSAIDs, hormone replacement t

21、herapy, alcohol consumption, diabetes mellitus, performance of bowel screening, and non-statin cholesterol-lowering medication.,Mamtani R, et al. PLOS Medicine, April 26, 2016,混杂偏倚控制方法的正确应用,37,An example: Statins, Cholesterol, and Colorectal Cancer,Association between Reduction in Serum Cholesterol

22、and Colorectal Cancer,Mamtani R, et al. PLOS Medicine, April 26, 2016,混杂偏倚控制方法的正确应用,38,An example: Statins, Cholesterol, and Colorectal Cancer,胆固醇水平升高是否一定是导致结直肠癌风险降低的原因?,Mamtani R, et al. PLOS Medicine, April 26, 2016,U,U,混杂偏倚控制方法的正确应用,An another example:,混杂偏倚控制方法的正确应用,从“流行病学三角”谈起(Starting from the

23、“epidemiology triangle),40,混杂偏倚控制方法的正确应用,对混杂路上的混杂因子施加条件,可以控制混杂偏倚,图1中(引自:Hernan MA. Am J Epidemiol. 2002; 155(2):176-84. ),暴露(E)和疾病(D)有共同原因C,因此C是混杂因子,用粗ORED测量E对D的效应会产生混杂偏倚,对C施加条件可控制混杂偏倚;图2和图3中,暴露(E)和疾病(D)的共同原因U(未观察或不可测量),但在混杂上有已知的混杂因子C,对C施加条件也可以控制混杂偏倚,这是因为对C施加条件后,就阻断了整个混杂路。,41,混杂偏倚控制方法的正确应用,对替代混杂因子施加

24、条件,也可以控制混杂偏倚,图4中(引自:Hernan MA. Am J Epidemiol. 2002; 155(2):176-84. ),C不是混杂因子U(未观察或不可测量)的混杂路上的混杂因子,此时,理论上对C施加条件并不能控制混杂因子U。但是,若C与U高度相关,对C施加条件则可以控制混杂因子U;此时C称为U的替代混杂因子(surrogate confounding) 。,通常情况下,当混杂因子不可测量时,控制其替代混杂因子 可以部分控制混杂偏倚。例如,如果C体现了混杂因子U的错分,C与U之间的相关性越强,考虑C为一个混杂并对其施加条件就越符合情理。,42,混杂偏倚控制方法的正确应用,对因

25、果路上的中介因子施加条件,可能会导致过度调整偏倚,图5(引自: Schisterman EF. Epidemiology. 2009 ;20(4):488-95 )是一个对中介变量施加条件的简单因果图模型。过度调整偏倚(overadjustment bias )是指在估计暴露E对结局D的总效应时,对暴露到结局因果路上的中介变量( intermediate variable )M或中介变量的代理变量( proxy for an intermediate variable )施加条件,而导致的偏倚。 (1)直接对中介变量M施加条件,则产生过度调整偏倚,43,混杂偏倚控制方法的正确应用,对因果路上的

26、中介因子施加条件,可能会导致过度调整偏倚,(2)对中介变量的后代代理节点施加条件,也会产生过度调整偏倚,自然流产史,图6(引自: Schisterman EF. Epidemiology. 2009 ;20(4):488-95 )是对未测量或观察的中介变量U的后代代理节点 (descending proxy for an intermediate variable )M施加条件的例子。此时,使因果路E U D部分地被阻塞,而导致过度调整偏倚。在E对D没有直接效应(DE=0)时的采用广义线性模型:,自然流产史,未调整M,调整M,bias=,图6,D,M,目的:估计E对D的总效应。图6,44,混杂

27、偏倚控制方法的正确应用,对因果路上的中介因子施加条件,可能会导致过度调整偏倚,(3)对中介变量的祖先代理节点施加条件,不会产生过度调整偏倚,图7(引自: Schisterman EF. Epidemiology. 2009 ;20(4):488-95 )是对未测量或观察的中介变量U的祖先代理节点 ( ascending proxy )M施加条件的例子。此时,不会阻塞因果路E U D,故不导致过度调整偏倚。在E对D没有直接效应(DE=0)时的广义线性模型为:,bias=,=,未调整M,调整M,则:,目的:估计E对D的总效应。,45,混杂偏倚控制方法的正确应用,图11a图11d中(引自:Herna

28、n MA. Am J Epidemiol. 2002; 155(2):176-84. ),暴露(E)和疾病(D)没有共同原因;在暴露(E)与疾病(D)之间没有其它的因果路。因此,粗ORED,可以测量E对D的效应。若对碰撞节点(C)施加条件,反而会导致新的偏倚产生。,对碰撞节点施加条件,会产生碰撞偏倚(collider-stratification bias),FIG.11a,FIG.11b,FIG.11b3,FIG.11b3,46,混杂偏倚控制方法的正确应用,举例1:对于下图(引自:Hernan MA. Am J Epidemiol. 2002; 155(2):176-84. )中的F(碰撞节

29、点)施加条件(例如,分层分析),则会导致E与D之间的假关联性,这种偏倚叫做碰撞偏倚。,47,混杂偏倚控制方法的正确应用,对碰撞节点施加条件,会产生碰撞偏倚(collider-stratification bias),对混杂路上的碰撞节点施加条件,会开放新的混杂路而增加新混杂偏倚 举例2:对于下图中混杂路ECD中的混杂因子C施加条件,由于C也是一个碰撞节点,则对C施加条件后,开放了新的混杂路EA.BD,从而产生了新的混杂偏倚。,引自:Greenland S. Epidemiology.1999;10(1):37-48,48,混杂偏倚控制方法的正确应用,对碰撞节点施加条件,会产生碰撞偏倚(coll

30、ider-stratification bias),不必要对任何变量施加条件而进行调整的情形,(1)不必要调整( Unnecessary adjustment )的基本情形,不必要调整是指在估计E D的总效应时,对变量进行调整后,不影响总效应的估计,也称为中性偏倚调整( bias-neutral adjustment )。以图9说明不必要调整的几种类型:1)对完全处于系统外的变量(C1)进行调整;2)对仅作用于暴露(E)的变量(C2)进行调整;3)对不在E D上的E的后代节点(C3)进行调整;4)对不在E D上的D的祖先节点(C4)进行调整;5)对结局D的后代节点(C5)进行调整。,引自: Schisterman EF. Epidemiology. 2009 ;20(4):488-95,(2)估计目的或估计方法不同,调整的必要性不同,49,混杂偏倚控制方法的正确应用,对碰撞节点施加条件,会产生碰撞偏倚(collider-stratification bias),Acknowledgement,山东大学公共卫生学院生物统计学系因果推断课题小组,The End,Thanks,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。