1、 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 医学科研设计与统计学思维 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 医学统计学要说它简单吧,其实也挺简单的,常见的 统计方法也就十余种,在教科书上都能找到,只要熟练掌握了, 虽不敢夸下海口说可以 “以秋风扫落叶的气概横扫四海之内的杂 志 ”,但足以轻车熟路地应付一般的科学研究。要说它复杂吧, 也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在 SCI 杂志上,乱用统计学的现象多如牛毛。很多人在学习医学统计 学时,都在抱怨自己很难走出 “一学就会,一会就用,一用就错, 一错就懵 ”的怪圈。究其原因,主要是我们在学习医学统计学时 都抱着一
2、副 “依葫芦画瓢 ”的态度,试图 “套用统计学方法 ”来解决 自己面临的问题,而不去仔细思考统计学方法的本身的特点。 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 没有设计的临床干预试验 1685年抢救英国国王查理二世 ( Charles II , 1630-1685) : “ 一品脱 ( 0.568L) 血从右臂放出 , 半品脱血从左肩放出 ,服下催吐剂 、 两付汤药和一种由 15成份的灌肠剂 。 刮国王的头部 , 直到起一个大泡 。 再服打喷嚏的药粉和更多的催吐剂 。 继续放血 , 加服止痛剂 。 把沥青和鸽子粪混合后敷于脚上 。 服一种含有 10种成份的草药 。 最后服人头盖骨粉制成
3、的 40滴糖浆 , 外敷牛黄 。 然后 , 国王陛下死了 。 ” 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 有设计的临床干预试验 1747年 5月 20日 , 英国的 J. Lind医生将 12名病情相同似的患者带到一艘船上 。 患者的主要症状是牙龈溃烂 , 皮肤有出血点 ,双膝无力 。 Lind将 12名患者分为 6组 , 分别给予下列主要干预: A组:每天饮 1夸脱 ( 1.136L) 苹果汁; B组:服 25滴硫酸丹剂 ( elixir vitriol) , 每天 3次; C组:服 2匙醋 , 每天 3次; D组:每天饮约半品脱海水 , 服缓和的泻药; E组:每天食 2个桔子 ,
4、 一个柠檬; F组:每天服由大蒜 、 芥子等成份组成的干药 。 当 6月 16日船返回英国 Plymouth港时 , 所有患者的病情都有好转 , 其中 E组恢复的最快 、 最好 , 其中一人到第 6天就可以工作了 。 B组也有一人比登船时健康 。 Lind医生的试验并没有得出明确的结论 , 直到 160年后 , 通过动物实验才真正从科学意义上解释了E组疗效最好的真正原因 。 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 J.Lind医生的研究有二点符合统计学的设计: 1、设立了对照(相互对照); 2、质量控制(消除了一些混杂)。 如果我们今天重复 J.Lind的研究,在统计设计的上 还需要
5、做到以下几点: 1、研究对象的定义与纳入标准和排除标准 2、足够多的观察对象 3、效应指标的选择 4、结论是否能外推 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 统计学方法用于干预试验 1835年,法国医生 P.C.A. Louis 对当时流行的“放血”疗法治疗肺炎的效果进行了比较,发现“放血”的疗效不象预期的那么好,而且早期“放血”和晚期“放血”组比较,患者的诊断、病情、病程、年龄等方面的差异很大,比较平均治愈时间意义不大。因为晚期“放血”组的平均治愈时间长,但该组患者病情重、病程长、年龄大。 Louis对医学研究的方法学作出了很大贡献: ( 1) 用数字的方法表示不同疾病患者的特征和
6、预后; ( 2) 提出了临床疗效对比的前瞻性原则; ( 3) 提出抽样误差和混杂 ( confounding) 概念 。 其中前瞻性研究和减少混杂 , 分别成为当今临床试验和流行病学研究的基本研究方法; ( 4) 在 J. Gavarret 的协助下 , Louis的数字方法发展为 “ 概率框架 ” ,Gavarret也于 1840年在巴黎出版了世界第一部医学统计学教科书 。 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 “ 非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险 ” F. Yates, M.J.R. Healy 医学论文中的统计问题 统计知识的
7、运用 撰写论文:报告自己观察或实验的研究结果 阅读论文:吸收新知识,了解学术进展 1996年,对申报科技成果的 4586篇科研论文分析, 统计方法使用率为 76%。 医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 “ 调查结果反映了医学论文作者统计知识和统计水平的低下,也再次强调了生物统计学者不是令人生畏的检查官。恰恰相反,生物统计学者是我们的可贵盟友。生物统计学不是远离我们的数学,而是现代医学的一门基本学科,就像大厦中的一个支柱 ” -JAMA的编辑部 60年代到 80年代 , 国外医学杂志调查结果:有统计错误的论
8、文 20%72%。 1984年对 中华医学杂志 、 中华内科杂志 、 中华外科杂志 、 中华妇产科杂志 、 中华儿科杂志 595篇论文的调查结果: 相对数误用为 11.2% 抽样方法误用 15.9% 统计图表误用 11.7% 1996年对 4586篇论文统计 ( 中华医学会系列杂志占6.9%) , 数据分析方法误用达 55.7%。 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 科学容不得半点虚假,造假者一旦被揭露就背上了永远洗脱不掉的耻辱 。 伪造统计数据违反科学道德 据 1976年 New Science 杂志关于科研舞弊行为的调查 74%的调查表反映有不正当修改数据的情况,其中,17%
9、拼凑实验结果, 7%凭空捏造数据, 2%故意曲解结果。 就统计学本身来说,正确实验设计得出的统计结果,是用 P值作为“重现性”的概率保证。 P0.05,就是说实验结果显示的差别是机遇所致的可能性不足 5%,或者说,别人在同样的条件下重复同样的试验,得出相反结论的可能性不足 5%。 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 总体 样本 抽取部分观察单位 统计量 参 数 统计推断 统计推断 statistical inference 如:样本均数 样本标准差 S 样本率 P 如:总体均数 总体标准差 总体率 X内容: 1. 参数估计(estimation of parameters) 包括:点估计与区间估计 2. 假设检验 ( test of hypothesis)