1、医学研究设计的重要性,主 讲 人:黄品贤所在部门:基础医学院预防医学教研室联系方式:联系电话:51322156网 址:http:/,医学研究的基本程序,好的研究首先必须有一好的设计。,医学统计工作的基本步骤,邢晓辉等南方医科大学20062008年度医学研究生学位论文进行统计审核 结果显示:1495名医学研究生学位论文中涉及统计推断的为1342份,占全部论文的89.8%。1342份学位论文中有98.2%的学位论文存在27类的统计学错误,仅1.8%的学位论文没有统计学错误。,医学论文中的统计问题,表1 南方医科大学20062008年度医学研究生学位论文统计审核结果(n,%),高水平科研单位博士学位
2、论文的统计审核,2006年,李长平、胡良平对部分高水平科研单位的博士学位论文220余篇进行统计审核,其中使用统计学分析方法的150篇论文中,有92篇论文存在统计学方面的问题,占61.3%。存在问题:实验设计及数据分析方面的错误。 博士学位论文中统计学方法误用的现象比较严重,应引起有关单位研究生、研究生导师及单位领导的高度重视。,我国80的医学杂志论著有统计学错误 胡良平,胡良平教授说:“让人忧虑的不仅是上述现象,它们背后所反映出来的是我国整个医学界对统计学的不重视,对统计学方法掌握和应用的不合格。”就整个医学界的整体来看,统计学的处境不容乐观行政主管部门没有给予医学统计以正确、恰当的认识;有关
3、业务人员统计学知识和基本功底太薄弱;相关学校的统计教学内容陈旧,方法落后;有关医学杂志并没有统计学专家参与稿件审阅;有关科研课题和科研成果的评审也没有统计学专家参与。,课题缺乏统计研究设计方案或设计方案经不起推敲;实验研究缺乏必要的预实验;收集数据不当,不可避免地导致误用统计分析方法;用单因素设计取代多因素设计,无法考察因素之间的交互作用误用检验分析一切定量资料;误用检验分析一切定性资料;误用直线回归方程表示有明显曲线变化趋势的资料;用一元统计分析方法取代多元统计分析方法;.,我国80的医学杂志论著有统计学错误 胡良平,更为严重的错误是: 错误统计设计指导下收集的错误数据,又用错误的方法得出错
4、误的结论常被写进论文,“证明”了新发现或新发明,然后这些充斥错误统计数据和结论的论文堂而皇之地刊登在我国优秀期刊上。,我国80的医学杂志论著有统计学错误 胡良平,有严重统计学错误的论文怎能说明作者的观点?质量不高的杂志怎能推动医学新知识的严肃交流?有错不改或根本不知道有错误存在又怎能促进整个国家医学的发展呢?,我国80的医学杂志论著有统计学错误 胡良平,在2009年8月“全国统计学培训班” 胡良平,“如此多的问题和错误,如此大声的呐喊和呼唤,竟然不能触动医药科研主管部门的领导者,实在是我国医药科技事业的一大悲哀!” “统计学对保证科研工作的科学性、严谨性、经济、高效,推动整个医学界良好发展都是
5、极为重要的。”,研究者的苦恼.,“面对大量研究数据不知道应该用哪种统计分析方法?怎样表达统计结果才是规范的?” “从事医学研究后才知道统计设计很重要,但是,课题要结题,只能将错就错。” “医学统计学难学、难掌握、难应用!即使认真听也常常感觉像听天书,即使听懂了也依然不会用。” “医学研究设计是最重要的,但是我不知道该怎样设计。”,实话实说.,统计学是一门应用性很强的学科,内容丰富,灵活性很强,即使老师传授给您的全是“点金术”,还需要您有一定的基础,并在研究中领悟和反复实践。,胡良平主编的参考书,胡良平主编的参考书,开题报告中存在的主要统计问题,研究设计类型不明确、不合理;设计很优秀却被误认为是
6、完全随机设计样本含量估计缺乏依据技术路线不够细化统计分析方法表述不规范,局限于基本统计分析应用随机分配方案缺乏,缺乏考虑主要影响因素的组间均衡,博士生:共20个,有19个博士没有给出“样本量估计的依据”,有1个所给的依据不够完善。硕士生:绝大多数学生也没有给出“样本量估计的依据”。孙悦礼给出参数、计算公式,但需要再次确认计算。基地研:几乎全部没有给出“样本量估计的依据”。,样本含量估计缺乏依据,样本量的估计,样本含量估计是指为确保研究结论在一定检验效能基础上的最少观察单位数。医学研究没有绝对的样本量标准。 样本含量的大小应根据研究目的、研究设计的类型、研究资料的性质、接受的处理因素、研究对象的
7、种类、研究阶段等因素而决定。 样本含量太大一是浪费二是难以做好质量控制;样本含量太小容易犯第二类错误。,样本含量的估计,一、影响样本含量大小的条件 1.第一类错误的概率(检验水准)。:常取0.05 2.检验效能(把握度1-)0.75。检验效能即在特定的水准下若总体间确实存在着差异,此时该次实验能发现此差异的概率。1-常取0.80、0.85、0.90。 3.所比较的两个总体参数的差值:可根据专业上有意义的差值代替 4.总体标准差:由样本标准差代替、查阅文献,二、样本量的估计,(1)估计总体均数时样本量估计(2)估计总体率时样本量估计(3)样本均数与总体均数比较的样本量估计(4)完全随机设计两样本
8、含量相等时均数比较的样本含量估计(5)完全随机设计两样本含量不等时均数比较的样本含量估计 (6)配对设计两样本均数比较的样本量估计(7)完全随机设计多样本均数比较的样本量估计(8)完全随机设计两样本率比较的样本含量估计(9)完全随机设计多个样本率比较的样本含量估计(10)两样本相关系数比较的样本量估计(11)不配对病例-对照研究设计病例数与对照数相等时的样本含量(12)不配对病例-对照研究设计病例数与对照数不相等时的样本含量(13)病例-对照研究设计时样本含量(配对对照研究的样本含量)(14)队列研究设计四格表资料统计分析时样本含量(已知RR)(15)队列研究设计四格表资料统计分析时样本含量(
9、已知p1、p2),(1)估计总体均数时样本量估计,例题1:已知某地成年男子心率的标准差为8.9次/分,现在某研究想进一步了解该地区成年男子心率的总体平均水平,若规定误差不超过5次/分,取=0.05,试估计需要调查多少人?,其中,n,s 分别为样本含量、允许误差、总体标准差和样本标准差。,(2)估计总体率时样本量估计,例题2:某研究欲调查乳腺小叶增生的发病率。已知一般中青年女性乳腺小叶增生的发生率约占70%。要求正式调查时所得样本率与已知发生率相差不超过5%的可能性不大于0.05,如果采用简单随机抽样,需要多少调查对象?,其中:n,p 分别为样本量、允许误差、总体率的估计值。,(3)样本均数与总
10、体均数比较的样本量估计,例题3:某药厂评价某种治疗原发性高血压的疗效,要求用药后舒张压下降1.5kPa(1kPa=7.5mmHg)才算该药有实际疗效。根据以前试验表明舒张压下降量的标准差为3kPa。规定=0.05,检验效能1-=0,8,试估计需要多少病人进行临床试验?,(4)完全随机设计两样本含量相等时均数比较的样本含量估计,其中:为两均数之差,为总体标准差。结果:每组需要64例病人进行临床试验。,例题4:某药厂对新研发的降压中成药与标准降压药的疗效比较。已知标准降压药能使血压平均水平下降2kPa,期望降压中成药能平均下降4kPa,降压值的标准差为4kPa。=0.05,检验效能1-=0.8时,
11、需要多少病人进行临床试验?,(5)完全随机设计两样本含量不等时均数比较的样本含量估计两样本含量之比为n1:n2=1:k,其中:为两均数之差,为总体标准差。若以1:4的样本量作调查,应调查患者24人,正常人96人。,例题5:某研究者分析多毛症患者与正常人血清睾丸酮含量(ng%)的不同。根据其他研究者的血清睾丸酮含量的标准差为13.33。H0:1-2=0=0;H1:1-2=1=10。=0.05,检验效能1-=0.9时,由于多毛症患者较少,预计以1:4的比例调查患者与健康人,问需要调查患者与健康人各多少?,(6)配对设计两样本均数比较的样本量估计,例题6:用某药治疗硅沉着病患者后,尿矽排除量平均增加
12、15mg/L,其标准差为25mg/L。假定该药确能使尿矽排除量增加,定0.05(单侧),0.10,问需观察多少患者才能得出服药前后尿矽排除量之间的差别有统计学意义的结论?,(7)完全随机设计多样本均数比较的样本量估计,例题7:某中医院应用中西医结合治疗肺气虚、脾气虚、肾气虚慢性阻塞性肺疾病(COPD)患者,并与单纯西药为对照组,观察中西医结合治疗COPD患者不同中医证型的肺功能改善效果,根据查阅相关资料,肺气虚的FVC(L)为2.440.32;脾气虚为2.400.36;肾气虚为2.310.29;对照组为2.510.32。问该项临床研究估计需要观察多少病例数?,式中:n为各组样本所需的例数,i为
13、各总体的标准差,i为各总体均数,=i/k,k为所比较的样本组数,值是由、i=k-1、i=查值表。,(8)完全随机设计两样本率比较的样本含量估计,例题8:拟研究新研制的抗菌药物对某感染性疾病的治疗效果。经预试验,试验药有效率为80%,对照药有效率为60%。问正式临床试验每组需要观察多少病例(假设采用双侧检验)?,P1和p2分别为两样本率的估计值,p为两样本合并率。 每组需要观察109例患者。,(9)完全随机设计多个样本率比较的样本含量估计,例题9:某医院观察三种中药复方甲、乙和丙治疗某病的效果,初步观察结果甲复方有效率85.5,乙复方80.5,丙复方75.5,问正式试验需要观察多少例患者?,(1
14、0)两样本相关系数比较的样本量估计,例题9:设1=0.8,1=0.4,=0.05(单侧),=0.10,问需要多大样本例数?,需要41对样本(即每组需要41例)。,(11)不配对病例-对照研究设计病例数与对照数相等时的样本含量,例题10:一次吸烟与肺癌关系的研究,得知一般人群中,即对照人群(p0)中有吸烟史的人所占的比例为20%,比值比(OR)为2,设=0.05(双侧),=0.1,求样本量。,P0表示对照组中暴露着的比例,p1表示病例组中暴露者的比例。每组需要230人。,设病例组病例数与对照组例数之比为1:c,则病例组的样本量计算公式为:,(12)不配对病例-对照研究设计病例数与对照数不相等时的
15、样本含量,例题11:如研究口服避孕药与先天性心脏病的关系,采用配对设计,设=0.05(双侧),=0.1,对照组暴露比例为p0=0.3,估计的OR为2.需要多少样本量。,(13)病例-对照研究设计时样本含量(配对对照研究的样本含量),式中,p1为估计的病例中暴露者的比例;p0为估计的对照组中暴露者的比例;n为不一致的对字数。,(14)队列研究设计四格表资料统计分析时样本含量(已知RR),例题12:某研究者拟采用队列研究的方法评价某药物预防脑卒中复发的效果,根据流行病学调查得不用药者脑卒中的复发率为23%,估计RR值为0.5,设=0.05,=0.1,问需要多少样本量?,p0、p1分别表示对照组与暴
16、露组的发病率。,(15)队列研究设计四格表资料统计分析时样本含量(已知p1、p2),例题13:某研究者拟采用队列研究的方法评价某药物预防脑卒中复发的效果,根据流行病学调查得不用药者脑卒中的复发率为23%,用药者复发的概率为10%,设=0.05,=0.1的条件下,问需要多少样本量?,p0、p1分别表示对照组与暴露组的发病率。,(16)其他情况样本量估计,多因素分析时,多元线性回归分析样本含量至少变量数的10倍;logisitic回归样本含量至少为变量数的20倍;Cox回归截尾例数小于20%,样本含量至少变量数的10倍。计数资料行列表资料2检验,一般不宜有1/5以上格子理论频数小于5,或有一个格子
17、的理论频数小于1。,临床非劣及等效性试验样本含量估计的简算法,临床试验中作两药等效判别时,不能依据“显著性检验P0.05”,而应采用“非劣或等效性试验(noninferiority or equivalence trials) 的P0.05”。实施时,应确定、;选择单侧或双侧;规定等效标准();估算等效或非劣性试验所需要的例数等。,对于计数资料(率),其例数估算公式为:非劣性试验: n =2( u+u)2p(1-p)/2等效性试验: n =2 (u+u/2) 2p(1-p)/2 其中是等效标准(界值),u、u为单侧标准正态离差界值,n为样本含量,P 是平均有效率。 注意:等效性试验实际是高方向
18、及低方向的两个单侧检验,因此在估算例数时,应采用u/2,而不是用u/2。,临床非劣及等效性试验样本含量估计的简算法,临床非劣及等效性试验样本含量估计的简算法,u、u、u/2 等值,使用不够方便。其实在临床试验中通常用=0.05,=0.2 (把握度=80%),非劣性试验为单侧检验,等效性试验为两个单侧检验。对于计数资料(率),其例数估算公式为(=0.05,=0.2):非劣性试验: n = 12.365p(1-p)/2等效性试验: n = 17.127p(1-p)/2,临床非劣及等效性试验样本含量估计的简算法,对于计量资料(均数) ,其例数估算公式为:非劣性试验:n = 2(u+u)2(s/)2
19、等效性试验:n = 2(u+u/2)2(s/)2 其中是等效标准(界值),u、u为单侧标准正态离差界值,n为样本含量,s是估计的共同标准差。注意:等效性试验实际是高方向及低方向的两个单侧检验,因此在估算例数时,应采用u/2,而不是用u/2。,对于计量资料(均数) ,其例数估算公式为=0.05,=0.2:非劣性试验:n =12.365(s/)2 等效性试验:n =17.127(s/)2 其中是等效标准(界值),s是估计的共同标准差。如=0.1 时,上式算得的非劣性试验例数再乘以1.385,而等效性试验所得例数再乘以1.264 即可。,临床非劣及等效性试验样本含量估计的简算法,药品注册管理办法中样
20、本含量的最低要求,期:试验组2030例期:试验组100例期:试验组300例期:试验组2000例。生物利用度试验:1925例;等效性试验:100对。,书名:医学统计学主编:史周华出版社:人民卫生出版社出版日期:2012.8ISBN:978-7-117-15886-2/R15887参编:黄品贤,技术路线不够细化,技术路线应含有设计类型、纳入标准、排除标准、随机分组、样本量、一般资料的组间均衡性检验、治疗方案、疗程、疗效评价指标及观察时间、数据处理等信息。,技术路线的书写,技术路线是指根据研究目标将研究具体的实施流程采用框图制作成树形图。要阐述清楚可操作性的每一步骤的关键点,应尽可能详尽,以达到一目
21、了然的效果。一般包括研究对象、采取的技术手段、具体步骤及解决关键性问题的方法等。合理的技术路线可保证既定目标的顺利实现。技术路线的合理性并不是技术路线的复杂性。,对照设置、样本量,疗程1、2、3,统计分析方法表述不规范,局限于基本统计分析应用,统计学分析方法的选择,对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适的统计学分析方法,不应盲目套用t 检验和单因素方差分析。对于定性资料,应根据所采用的设计类型、定性变量的性质和频数所具备的条件及分析目的,选用合适的统计学方法,不应盲目套用2检验。对于回归分析,应结合专业知识和散点图,选用合适的回归类型,不应盲目套用简单直线回
22、归分析。对于具有重复实验数据检验回归分析资料,不应简单处理。对于多因素、多指标资料,要在一元分析的基础上,尽可能运用多元统计分析方法,以便对因素之间的交互作用和多指标之间的内在联系做出全面、合理的解释和评价。,计量资料统计描述:若数据服从正态分布或近似正态分布,用均数标准差( )表达;若数据不服从正态分布,用中位数(M)最小值和最大值(min,max)表达,以及误差条图、直方图、线图等。统计推断:若数据服从正态分布或近似正态分布且方差齐,两独立样本组间比较宜用t检验;三组及以上组别独立样本间比较宜用方差分析及SNK检验或LSD检验或Dunnett-t检验;多个时间点连续观察指标组间比较宜用重复
23、测量数据资料的方差分析;配对设计宜用配对t检验等。,统计学分析方法的选择,计数资料统计描述:采用频数、构成比、率、相对比表示,以及采用直条图、百分构成图、线图等。注意分母不宜小于30。统计推断:若成组设计数据资料呈二分类或多分类无序时,宜用2检验或fishers检验;多中心研究时宜用分层2检验。若配对设计数据资料呈二分类或多分类有序,宜用配对2检验和一致性检验。若数据资料呈分类不同的有序资料,宜用秩和检验、等级相关分析及线性2检验。,统计学分析方法的选择,等级资料统计描述:采用频数、构成比表示,以及采用百分构成图等。注意分母不宜小于30。统计推断:成组设计分析指标呈等级有序、不服从正态分布或近
24、似正态分布,以及分布不明时,两组间比较宜用秩和检验或Ridit检验;成组设计三组及以上组分析指标呈等级有序时,组间比较宜用Kruskal-Wallis H检验,多重比较采用Nemenyi法检验。若分析等级指标随时间的变化,宜用时间趋势2检验等。,统计学分析方法的选择,医学研究设计类型与统计分析方法,应说明研究设计的名称和主要方法。观察性研究设计:前瞻性、回顾性、横断面调查研究实验研究设计:具体的设计类型,如自身配对设计、成组设计、交叉设计、析因设计、正交设计等临床试验设计:属于第几期临床试验,采用了何种盲法措施等 ;主要做法应围绕4 个基本原则( 重复、随机、对照、均衡、盲法) 概要说明,尤其
25、要告知具体如何控制重要非试验因素的干扰和影响。,1.观察性研究设计类型,(一)观察性研究设计,(1)横断面研究,2.观察性研究的统计学分析,t检验、F检验,(2)病例对照研究,2.观察性研究的统计学分析,(3)队列研究,2.观察性研究的统计学分析,表1 根据变量的类型可选择的统计分析方法,2.观察性研究的统计学分析,表1 根据研究设计和变量类型选择统计分析方法,2.观察性研究的统计学分析,(二)实验研究设计,将一组随机抽取的实验对象随机分配到两种或多种处理组,观察比较不同处理因素的效应。设计类型基本原则:随机、对照、重复基本要素:研究对象(动物或生物材料、人)、处理因素及水平、实验效应非处理因
26、素的控制:性别、窝别、体重、年龄、病情、病程等实验效应的评价指标:所用评价指标及其测量方法、测量误差的控制及评价(多测量者、多测量仪器等问题),1.实验研究设计的类型,完全随机设计(两组、多组)配对(配伍)设计交叉设计拉丁方设计裂区设计嵌套设计析因设计正交设计重复测量设计,http:/ 完全随机设计两样本均数比较,2.实验研究的统计学分析,2.实验研究的统计学分析,临床试验(clinical trial):指任何在人体(病人或健康志愿者)进行药物的系统性研究,以证实或揭示试验药物的作用、不良反应及/或试验药物的吸收、分布、代谢和排泄,目的是确定试验药物的疗效与安全性。临床试验一般分为I、II、
27、III和IV期临床试验。临床治疗:是根据每一位患者的具体情况对症施治,无需统一的方案,目的是将患者治好。 所以,临床试验必须有一个共同遵循的试验方案,对所有参与试验的受试者均按同一方案进行治疗或处理,不得因人而异。,(三)临床试验设计,1.临床试验设计类型,(1)平行组设计 (parallel group design) (2)交叉设计(cross-over design) (3)析因设计(factorial design) (4)成组序贯设计(group sequential design)(5)其它可用的研究方法,2.临床试验的统计学分析,多因素方差分析(统计设计类型)协方差分析(随机设计
28、、区组设计)多元线性回归分析(具体方法;入;出)Logistic回归(具体方法;入;出)生存分析 1)寿命表法 2)Kaplan-Meier法 3)Log-rank检验 4)Cox比例风险模型判别分析(具体方法)聚类分析(具体方法)主成分分析与因子分析(旋转方法),3.临床试验的多因素分析,典型相关分析对应分析统计预测综合评价综合评分法综合指数法层次分析法TOPSIS法秩和比法,研究类型研究对象来源、选择方法【标准:诊断标准(中医、西医)、入选标准、剔除标准,等】基本原则:随机、对照、重复、盲法;(分组方法:完全随机、配对、配伍、分层随机分组等;非随机化分组。各组样本量应相等或相差不多)样本含
29、量估计:(参数、参考文献、计算公式、软件)观察方法及评价标准:(随访:有无失访、失访比例及失访的详细阐述) 、有无“知情同意”)均衡性检验:如年龄、性别、病情、病程等一般资料的具体分析结果。实验、试验或调查资料的搜集过程等。研究中统计分析结果的规范表达。,4.临床研究设计方案统计表达,随机分配方案缺乏,缺乏考虑主要影响因素的组间均衡,http:/,医学科研工作的时间分配,内容 占时(%) 选择与确立科研课题 10 搜集科研资料 50 整理与分析资料 30 撰写科研报告 10,医学研究设计的重要性,科研设计是医学科学研究的灵魂。严密的设计是取得有价值结果的先决条件。缺乏严格的设计,或者设计不合理,那么,研究即使有重要的发现也属偶然,或只能得到错误的结论。从这个意义上说没有“设计”就没有科研。专业设计:选题、查阅文献、假说、预试验统计设计:设计、对象、分组、数量、指标、分析方法,(设计类型)(随机抽样)(随机分组)(样本量估计)(统计分析计划)(统计分析报告),授人玫瑰,手留余香!,谢谢!请提宝贵建议!,