1、常见统计学错误与纠正- 设计与分析方积乾中山大学公共卫生学院医学统计与流行病学系2013年 12月1. 终点指标过多 , 大海捞针w 临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动! ”w 生理、生化、组织学、基因,都做;“内容丰富,显得水平高! ”w 许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标标 ”错在哪里?w 哪些指标可能有组间差异,必须心中有数。科研的结果应当预见 假说是科研的灵魂心中无数,不要 “先上马再说 ”w 指标多,实验工作量大。大海捞针 碰运气,不是科研w 指标多,翻来覆去分析,制造假阳性Nature杂
2、志统计学指南:常见错误之一为何翻来覆去分析,会制造假阳性?Nature常见错误之一w 多重比较 : 对一组数据作多项比较时,必须说明如何校正 水平,以避免增大第一类错误的机会应当如何?w 主要终点 (primary end point) :只能一个次要终点 (secondary end point) : 可以几个 , 但勿过多w Bonfferoni 校正当同一组数据同时作 k次分析时,若限定犯假阳性错误的概率总共不超过 ,则每次分析要用 来控制假阳性的概率。例 w 事后分析( Post hoc analysis)看到数据之后才想起来做的分析其结果往往不能被进一步研究所确认w 不鼓励事先并未计
3、划的亚组分析和校正分析2. 事后分析,见机行事为何不鼓励事后分析?w 数据是现象,现象具有偶然性;看到数据后进行的 “分析 ”属于故作姿态,变偶然为 “必然 ” 忽悠!w 看到数据后增加的 “分析 ”,也属于多重分析,增加假阳性的机会w 必要的亚组分析有助于发现适应症,指导个体化治疗;必要的校正分析有助于消除混杂偏倚,公平、公正地比较疗效w 亚组分析和校正分析必须事先在研究计划里规定,并说明理由;写文章时,申明这类分析是事前计划好的w 事后决定做的分析,如果想写,不能算是正式结果,只能视为探索性分析。应当如何?3. 随机化,说而不做,做而不严w 处理分配的随机化为什么这么重要 ? (1) 消除分配处理有意或无意的偏倚。(2) 为实施盲法创造条件。(3) 使有可能利用概率论来描述各干预组之间的差异有多大可能仅仅是由偶然性造成的。w 将随机化当作 “廉价名词 ”,实际没做,却写 “随机分成两组 ” 科研道德?