国家自然科学奖推荐书式样.DOC

上传人:国*** 文档编号:2051404 上传时间:2019-04-04 格式:DOC 页数:34 大小:297KB
下载 相关 举报
国家自然科学奖推荐书式样.DOC_第1页
第1页 / 共34页
国家自然科学奖推荐书式样.DOC_第2页
第2页 / 共34页
国家自然科学奖推荐书式样.DOC_第3页
第3页 / 共34页
国家自然科学奖推荐书式样.DOC_第4页
第4页 / 共34页
国家自然科学奖推荐书式样.DOC_第5页
第5页 / 共34页
点击查看更多>>
资源描述

1、141101.01.010.149国家自然科学奖推荐书式样国家自然科学奖推荐书( 年度)一、项目基本情况学科评审组: 序号: 编号:中文名 统计因果推断项目名称 英文名 Statistical Causal Inference主要完成人 耿直推荐单位(盖章)或推荐专家 中国数学学会1 多元分析 代码 11017552 统计计算 代码 1101764学科分类 名称3 代码所属科学技术领域 数理统计, 多元统计, 生物统计任务来源 国家自然科学基金委具体计划、基金的名称和编号:项目完成人耿直 1997 年获教育部跨世纪优秀人才项目;1999-2002 获国家杰出青年基金项目(19825103);1

2、999-2003,主持国家基金委重点项目:应用统计(19831010),此后参与应用统计重点项目三次:2005-2008(10431010)、2010-2013(10931002)、2014-2017(11331011)。承担了国家基金委面上项目(10771007):和(11171365),负责 973 项目子项目(2003CB715902)。探讨因果推断的统计方法:1)研究 Simpson 悖论、因果推断和不完全数据;2)提出替代指标悖论,又称中间变量悖论、工具变量悖论,研究不可忽略缺失数据机制和分析方法;3)研究网络图模型,探讨因果机制和因果网络的结构学习。已呈交的科技报告编号:项目起止时

3、间 起始: 2000 年 1 月 1 日 完成: 2015 年 12 月 1 日国家科学技术奖励工作办公室制241101.01.010.149二、项目简介(限 1200 字)本项目研究因果作用的评价方法和因果网络的参数学习和结构学习方法,探讨因果推断在生物医学中的统计问题。近年来,有关因果推断的研究成为了统计学最关注的热点研究方向之一。我们在因果推断方向作出了一系列成果 .关于著名的 Yule-Simpson 悖论,国内学者提出了一系列避免虚假相关性的条件和统计推断方法(JRSSB 1992,1993,1995,2002,2006 等)。针对生物医学中现有的替代指标准则,国内学者提出了替代指标

4、悖论(又称中间变量悖论、工具变量悖论 )(JRSSB, 2007, 2010 等) 。针对临床试验不依从情况,我们论证了因果作用的可识别性和统计推断方法,该成果为 2009 年Biometrics 的唯一讨论文章。在因果网络方面,我们提出了不完全数据学习因果网络的方法 (Artifficial Intelligengce, 2006),将大规模网络的学习问题分解为小网络学习问题的递归分解学习方法,提出因果网络的主动学习方法,利用最少的干预次数确定因果方向的最佳干预试验方法(3 篇论文发表在 J Mach Learn Research 2008) 。另外,我们参加了2008 年 World Co

5、ngress on Comput. Intelligence 组织了因果挑战,并获得了 Best Overall Contribution Award。我们在因果推断和因果机制方向的研究成果受到国际同行的关注,曾应邀在 ICIAM 2011 做 1 小时大会报告、日本统计计算大会做 1 小时特别讲座、CSPS-IMS 2005 的 55 分钟特别讲座 , IMS-APRM 2012 做了 45 分钟特邀报告等。本项目探索因果推断,主要研究内容为:1.替代指标(Surrogate)准则和替代指标悖论因果推断中的替代指标的准则是因果推断和医学研究的重要问题。Chen, Geng Simpson,

6、JRSSB 1951)的发现说明了相关不是因果,为统计学提出了挑战性的问题。统计学在因果方面的研究步履艰难,正如 Holland(1986,JASA)所说:Problems involving causal inference have dogged at the heels of statistics since earlest days.尽管目前人们在自然科学和社会科学的研究中可以利用先进的设备获得大量的数据,但是人们认识自然和社会的最大障碍之一也许是缺乏从获得的大量数据中认知因果关系的方法。Pearl (Causality, 2009, 2nd Ed):“在过去的一个世纪中,许多发现被推

7、迟是由于缺少描述因果的数学语言。”现在因果推断主要采用两种数学模型:潜在结果模型(Neyman, 1923; Rubin, 1974)和因果网络模型 (Pearl, 2000;Spirtes et al. 2000)。我们研究这两种因果模型,探讨因果作用的可识别性和因果网络的学习。主要创新点和贡献如下:1) 提出了替代指标悖论,探讨了替代指标的准则(多元统计 1101755;代表性论文 JRSS B 2007, JRSS B 2010, Stat Med 2011 等)在很多科学研究中终点指标(Endpoint)的观测非常困难、代价高或时间长。所以,常需要寻找替代指标(Surrogate)观测

8、。例如,临床试验评价治疗 AIDS 病药物,常用 CD4 作为替代指标,而难以用 10 年生存期的终点指标评价疗效。因此确定替代指标的准则是因果推断和医学临床试验的重要问题。目前已经提出了很多替代指标的准则,华盛顿大学 Prentice 院士(Statist. Med., 1989)提出了替代指标的条件独立性准则,称为统计替代指标,该论文成为这个刊物被引用最高的论文。Prentice 准则已经被临床疗效评价广泛使用。哈佛大学 Rubin 院士等人 (Frangakis and Rubin,Biometrics, 2002;Rubin,SJS, 2004)发现统计替代指标不满足因果必要性(因果必

9、要性:处理对替代指标没有因果作用,则处理对终点指标没有因果作用) 。他们对 Prentice 准则进行了批判,提出了主分层替代指标的准则。牛津大学统计系主任 Lauritzen (SJS, 2004)利用因果网络提出了强替代指标的准则,比主分层准则更严格地描述了替代指标与终点指标的因果路径的关系。我们(JRSS B 2007 Statist Med, 2011)发现 Prentice统计替代指标准则、Rubin 主分层准则和 Lauritzen 强替代指标准则都存在一个严重的问题,即用这些替代指标可能会得出与事实相悖的结论,这就是我们(JRSS B 2007)提出的“替代指标悖论(Surrog

10、ate Paradox)”:治疗 T 对替代指标 S 有正的平均因果作用(ACE),这些替代指标 S 对终点指标 T 也有正的因果作用,但是,该治疗 T 对终点指标 Y 有负的因果作用。该悖论可以表示为这个发现说明了目前的几种替代指标准则都存在严重的问题。Moore (Deadly Medicine, 1995)报道过著名的医药临床的惨案事件,描述了将抑制心律失常作为降低猝死的替代指标,最终发现上市的药物不但不能降低,反而增加了猝死的比率,导致数万人死于这类药物。 Alonso Ju Wu, He Spirtes et al. 2000)在高维数据情况下计算复杂性和统计检验功效等方面都有困难。

11、我们(AI 2006)提出利用不完全数据学习有向图的方法。我们(Xie Ma, Xie Kuroda, Geng, SPL 2003)提出了利用 Delta 和Epsilon 算法加速 EM 算法收敛速度的方法,这种加速算法只需要使用 EM 算法得到的估计序列,不需计算信息阵等附加计算。3) 可压缩性和混杂因素(多元统计 1101755; JRSS B 2002,JRSS B 2006 等)我们(JRSSB 2006)探讨一般分布的关联度量的可压缩性。两个变量的关联度量的正负号可能被一个混杂因素改变,称为 Simpson 悖论。Cox Ele J Stat 2009)引用。进一步,我们(Sta

12、t Sinica 2008)提出了多种关联度量之间强度的蕴含关系,探讨了各种关联度量可压缩性的条件。841101.01.010.149目前,所有因果推断几乎都要求不可忽略性假定,它是关键假定之一。我们(JRSSB 2002)在不需要这个可忽略性假定下探讨了混杂因素的提议和判断准则。流行病学研究中存在着不同的混杂定义,一直采用经验归纳出来的判别混杂因素的准则. 我们提出了混杂的形式定义, 并且提出偶然混杂因素的概念,给出了无混杂的充分必要条件,在此基础上论证了判断混杂因素的准则.判断混杂因素时常使用两个准则:可压缩性准则与可比较性准则.流行病学者对这两个准则存在争议.我们论证它们之间的关系和互补

13、性。我们(Wang, Geng et al. SS 2007 ) 探讨因果分布作用的估计精度,论证了调整混杂因素能消除偏倚,但是调整非混杂因素将会降低估计精度,该结果同样适应于小样本的情况。很多学者只是在大样本下比较估计量的渐近方差探讨是否有必要调整非混杂因素。我 们 (Wang, Geng et al. JSPI, 2009)探 讨 了 如 何 确 定 和 筛 选 多 混 杂 因 素 的 方 法 。 我 们 (Geng Ding,Geng 10th China & Japan Symposium on Statistics 的 Co-Chair of organizing committee

14、 (2010 年 10 月,成都,约 200 人)。1041101.01.010.1492. 研究局限性(限 1 页)因果推断是统计学研究中最具有挑战性的研究问题之一,不仅限于统计学方法自身的范围,还设计哲学领域和所应用领域。我们主要研究生物医学和经济学领域中的因果推断问题的统计方法研究。因果推断在决策、法律、心理、认知等社会科学领域都有广泛的应用前景。目前有人讲大数据时代不需要因果关系,只需要相关关系。但是,科学研究和决策更需要因果关系。大数据更有利于因果关系的研究。即使是网商做商品广告推荐,也应该探索因果关系,而不是表面的相关关系。Pearl (2011 年图灵奖获得者)曾指出:在过去的一个世纪中,许多(科学)发现被推迟是由于缺少描述因果的数学语言。统计学家 Holland(JASA,1983)曾指出:因果推断自始至终都缠住了统计学的脚后跟。统计学在因果推断方面面临着巨大的挑战。尽管目前参与因果推断挑战的统计学家人数远不如从事相关性统计研究的人数,但是最近几年因果推断吸引了越来越多的统计学家。

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。