科研统计方法简介.ppt

上传人:h**** 文档编号:2357914 上传时间:2019-05-08 格式:PPT 页数:81 大小:2.02MB
下载 相关 举报
科研统计方法简介.ppt_第1页
第1页 / 共81页
科研统计方法简介.ppt_第2页
第2页 / 共81页
科研统计方法简介.ppt_第3页
第3页 / 共81页
科研统计方法简介.ppt_第4页
第4页 / 共81页
科研统计方法简介.ppt_第5页
第5页 / 共81页
点击查看更多>>
资源描述

1、科研设计与统计分析方法简介,科研讲座,黄高明广西医科大学公共卫生学院 教授广西卫生经济卫生统计学会 会长电话:13878118862 Email:,第一部分 科研设计基本原理,主要内容,第二部分 常用统计方法及应用,第三部分 论文写作统计学应用评述,科研讲座,按在研究过程中对研究对象是否进行干预分为: (1)实验研究设计:有干涉 (2)调查研究设计:无干涉,科研设计的类型,第一部分 科研设计基本原理,提出问题,收集资料,分析结果,科学研究的分类,干预,观察,调查,实验,第一部分 科研设计基本原理,一、观察性研究的意义与特点,(一)调查研究的特点,1、研究因素是客观存在的2、不能用随机化分组来平

2、衡混杂因素对调查结果的影响。,(二)观察性研究的目的,1、描述某客观事物发生的水平及其分布规律,2、分析某事物各现象间的相关关系,例如:某地冠心病的患病水平如何?“三间”分布怎样?(三间:人间、时间、空间),哪些因素影响冠心病的患病水平?,一、观察性研究的意义与特点,二、观察性研究常用的方法,一、根据研究范围,全面调查(overall survey),非全面调查(un-overall survey),二、根据研究时间,横断面调查(cross-section study),纵向研究(longitudinal study),根据研究范围,全面调查(overall survey),非全面调查(un-

3、overall survey),(一)全面调查(overall survey):普查(census),(二)非全面调查(un-overall survey),1、重点调查2、典型调查3、抽样调查:(1)非概率抽样;(2)概率抽样,二、观察性研究常用的方法,将组成总体的所有观察单位全部加以调查,称为普查。理论上只有普查才能取得总体参数并且无抽样误差,但往往系统误差和过失误差较大。调查成本高,须花费大量的人力、物力、财力和时间。,(一)全面调查(overall survey):普查(census),优点:没有抽样误差,缺点:,(1)费时、费力、费钱;(2) 非抽样误差大,(结果不一定比抽样研究准确

4、),二、观察性研究常用的方法,(二)非全面调查(un-overall survey),1、重点调查:重点人群调查2、典型调查:好的典型;差的典型3、抽样调查:按随机化原则,从总体中部分观察单位进行观察。,二、观察性研究常用的方法,3、抽样调查 (sampling survey),(1)非概率抽样(non-probability sampling),碰巧抽样(accidental sampling),配额抽样(quotal sampling),滚雪球抽样(snowball sampling),二、观察性研究常用的方法,3、抽样调查,(2)概率抽样(probability sampling),应用

5、前提条件,(1)有明确的抽样框,(2)对每一个被调查的观察对象,事先能赋予一个被抽取的概率,(3)用随机抽样方法来抽取观察对象,二、观察性研究常用的方法,概率随机抽样的优点:,(1) 节约大量的人力、物力财力和时间,(2) 可估计抽样误差,进行统计推断,(3) 可避免或减小人为干扰所产生的误差,(4) 有利于保证和提高调查质量,(5) 应用范围广,二、观察性研究常用的方法,根据研究范围,全面调查(overall survey),非全面调查(un-overall survey),根据研究时间,横断面调查(cross-section study),纵向研究(longitudinal study),

6、二、观察性研究常用的方法,(一)横断面调查(cross-section study),指在特定时点或相当短的时期内(1周、3个月),在一定人群中应用普查或抽样调查方法,收集有关疾病或健康状况资料的调查方法。目的是描述疾病或健康状况的分布特征,探索影响疾病或健康相关因素。,现况调查:患病率调查,二、观察性研究常用的方法,二、观察性研究常用的方法,(二)纵向研究(longitudinal study),纵向研究就是在比较长的时间内,对某一事物的发生、发展进行有系统的定期的研究,也叫做追踪研究。,二、观察性研究常用的方法,1、回顾性调查:由果推因的研究,(二)纵向研究(longitudinal st

7、udy),病例对照研究(case-control study),二、观察性研究常用的方法,“反应停”事件,1957年,德国,上市一种新药非巴比妥类镇静药-“反应停”(-苯肽茂二酰亚胺,塞利多米)。广泛用于妊娠反应,销往46个国家,8000多例海豹肢畸形婴儿。,被美国科学杂志月球列为20世纪十大科学错误之一。,二、观察性研究常用的方法,2、前瞻性调查,(二)纵向研究(longitudinal study),也称队列研究(cohort study),二、观察性研究常用的方法,(二)纵向研究(longitudinal study),经典例子:英国流行病学专家Doll-Hill研究吸烟与肺癌关系的研究

8、。,Doll和Hill于1948年至1952年间,用回顾性配对调查方法研究了吸烟与肺癌的关系,其结果说明肺癌患者比对照者吸烟多、吸烟量大,开始吸烟年龄早,吸烟时间长。他们又于1951年至1976年间,用前瞻性调查方法研究了吸烟与肺癌的关系达20余年,其结果亦说明吸烟者比不吸烟者发生肺癌多,吸烟量愈大、吸入肺部愈深,患肺癌的危险性愈大。他们还证明吸纸烟又比吸烟斗或雪茄患肺癌更危险。戒烟后可以减少患肺癌的危险性。Doll和Hill应用流行病学方法阐明了吸烟和肺癌的关系,为研究多种癌症的病因和原因未明的疾病提供了一个典范。,二、观察性研究常用的方法,统计设计:对资料搜集、整理和分析全过程总的设想和安

9、排。是后续步骤的依据,是最关键的一环。,科研设计,专业设计,统计设计,成果: 先进性 创新性 科学性和可行性,第一部分 科研设计基本原理,实验设计的基本要素和原则,实验设计主要内容:,三要素,三原则,观察对象,处理因素,实验效应,对照原则,重复原则,随机化原则,三要素,处理因素,受试对象,某种降压药,高血压患者,服该药前后血压差,实验效应,实例:拟给原发性高血压病人服用某降压药A,观察服药前后舒张压差值情况,研究该降压药是否有效?,实验设计的基本要素和原则,1设立对照的重要意义,(1)“有比较才能鉴别”。实验研究最终要回答的问题是干预措施的效果有或无、高或低。要回答这两个问题,只有通过合理的对

10、比鉴别,才能确定干预措施是否有效以及有效程度。而对照是比较的基础。(2)对照的设置可以排除非研究因素对研究结果的影响。,(一)对照原则,对照的必要性-没有比较就没有鉴别,疾病的自愈倾向感冒、哮喘等,100名感冒患者体温、鼻塞流涕情况,1周后观察:体温下降和鼻塞流涕缓解状况,服用感冒药A,结论:该药能有效治疗感冒,改善鼻塞流涕状况,错误的设计,(一)对照原则,感冒的例子,200名感冒患者,服用药物A,1W后体温下降,症状缓解,不服用药物A,1W后体温下降,症状缓解,随 机,服药组100人,不服药组100人,治疗前症状差别无统计学意义,治疗1天时体温差别有统计学意义,1天后体温降至正常,3天后体温

11、降至正常,分析:,设计:,结论: 该药有效。,正确的设计,实验组的研究因素T产生的效应为E,非研究因素S1产生的效应为e1 ;对照组的非研究因素S2产生的效应为 e2 如果S1 = S2 , 则 e1= e2 实验组 T + S1 = E + e1 对照组 S2 = e2 T = E,设立对照的目的:使实验效应单独显示出来。,(一)对照原则,(1)对等 除处理因素外,对照组具备与实验组对等的一切非处理因素。(2)同步 对照组与实验组设立之后,在整个研究进程中始终处于同一空间和同一时间。(3)专设 任何一个对照组都是为相应的实验组专门设立的,不得借用文献上的记载或以往的结果或其它研究的资料作为本

12、研究的对照,2对照组设置的要求:均衡性,(一)对照原则,(二)随机化原则,随机化原则是指将研究对象随机分配到各组,使每一个研究对象都有同等的机会被分配到各组去。随机化分组方法:,半随机化:按就诊(入院)顺序、生日、住院号等;简单随机化:投硬币、抽签、随机数字随机区组:分层随机:,可靠性广义的重复包括:(1)整个实验的重复。 确保实验的重现性,以提高实验的可靠性;(2)用多个实验单位进行重复(样本含量)。 避免把个别情况误认为普遍情况,把偶然性或巧合的现象当作必然的规律,通过一定数量的重复,使结论可信;(3)同一实验单位的重复观察。 保证观察结果的精度。,(三)重复原则,(三)重复原则,重复是指

13、在相同实验条件下进行多次观察,结果的稳定程度。从概率论知道,观察次数愈多,从样本计算出的统计量(如样本均数、样本率等)愈接近总体参数(如总体均数、总体率等)。但观察次数也不能太多,否则不仅造成浪费,而且难于控制实验条件,造成实验结果的可靠性差。因此,重复原则的意义是在保证实验结果具有一定可靠性的前提下,确定最小的样本含量。即作样本含量的估计。,实验设计中的重复(replication)是指各处理组与对照组要有适当的样本含量(sample sizes)。,无限地增加样本含量,将加大实验规模,延长实验时间,浪费人力物力,反而增加系统误差出现的可能性。 样本含量不足,检验效能(Power,1)偏低,

14、导致总体中本来具有的差异无法检验出来。,(三)重复原则,影响样本含量的因素:,数据的种类:定量-等级-定性个体的变异:变异小,样本含量少组间的差别:差别大,容易鉴别,n少指标间的相关程度:相关大,n少设计方法: 方法不同,则公式不同各组例数的分配: 均衡时,n少I型错误和II型错误: 小,n大研究的质量: 控制混杂好, n少,(三)重复原则,第二部分 常用统计方法及应用,统计分析:统计描述和统计推断,计量资料: 计数资料:率、构成比、相对比等级资料:构成比,统计描述,统计推断,计量资料:t检验、方差分析 计数资料:卡方检验等级资料:秩和检验,关系研究:相关、回归分析、logistic回归分析,

15、第二部分 常用统计方法及应用,一、基本概念,二、统计分析:统计描述和统计推断,处理因素,受试对象,实验效应,定量方法,定性方法,(测量),计量资料,无序,有序,计数资料,等级资料,科研流程示意图,第二部分 常用统计方法及应用,统计描述,统计推断,统计分析的两大方面,资料的统计描述指标,一、计量资料:,正态分布:均数标准差,偏态分布:中位数四分位数间距,对数正态分布:几何均数标准差,二、计数资料:率、构成比、相对比,三、等级资料:构成比,(平均值为代表,标准差反映代表性),第二部分 常用统计方法及应用,A组:均数=1710.5 标准差=140.5 中位数=1750B组:均数=2370.5 标准差

16、=2975.9 中位数=1750,人大代表步入会场,AB两组人群收入情况调查,平均数代表性分析,平均数代表性分析,某山区10名健康儿童的头发中与血中硒的含量如下,用何指标进行描述?,编号 1 2 3 4 5 6 7 8 9 10,发硒 74 66 88 69 91 73 66 96 58 73血硒 13 10 13 11 16 9 7 14 5 10,经计算:,第二部分 常用统计方法及应用,某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表。,只能计算:阳性率,资料的统计描述,某医院比较急性黄疸型肝炎与正常人在超声波波型上

17、的表现,见下表。(只能计算构成比),资料的统计描述,(一)计量资料的统计推断(t检验和方差分析),1、单样本比较:样本均数与总体均数的比较(t检验)2、两样本比较:配对设计:配对t检验 非配对设计:完全随机设计t检验3、多样本比较:配伍组设计:配伍设计方差分析 非配伍设计:完全随机设计方差分析,某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?,单样本比较,(一)计量资料的统计推断(t检验和方差分析),为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了

18、10份乳酸饮料制品,分别用脂肪酸水解法和哥特里罗紫法测定其结果。,配对设计(自身对照),(一)计量资料的统计推断(t检验和方差分析),为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见表3-4,能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?,完全随机设计(非配对设计)两样本比较:,(一)计量资料的统计推断(t检验和方差分析),某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名

19、高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测定低密度脂蛋白结果。,完全随机设计(非配伍设计)多组比较,某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物(具体分配结果见例4-3),以肉瘤的重量为指标,试验结果见表4-9。问三种不同的药物的抑瘤效果有无差别?,配伍设计三样本比较,(二)计数资料的统计推断(卡方检验),1、只要是率、构成比(百分率)指标比较,用卡方检验即可。2、卡方检验方法:分配对设计和非配对设计(无论组别多少)3、两组率比较时注意事项:(校正条

20、件)4、单向有序资料比较,只能用秩和检验(检验效果有无差别),非配对卡方检验:,1. 当n40, T 5时,用(Pearson Chi-Square)2. 当n40,而1T5时,用(Continuity Correction)3. 当n40或T1时,用Fisher精确检验 (Fishers Exact test ),配对卡方检验:b+c40,否则需要校正,(二)计数资料的统计推断(卡方检验),秩和检验应用范围: 1、等级资料 2、不能用t检验或方差分析的计量资料(偏态分布:2倍标准差大于均数;开口资料),(三)等级资料的统计推断(秩和检验),某年某地一次伤寒爆发潜伏期频数表 潜伏期 发病人数

21、3 3 5- 24 7- 20 9- 17 11- 14 13- 7 15- 6 17- 2 19- 1 21 2,明显偏态,开口资料,用某药治疗不同病情的老慢支病人,疗效见下表,试比较两种病情的疗效有无差别? 疗效 单纯性 单纯性合并肺气肿 合计 控制 65 42 107 显效 18 6 24 有效 30 23 53 无效 13 11 24 合计 126 82 208 ,等级资料,(三)等级资料的统计推断(秩和检验),(四)常用的统计软件,统计软件:中文:PEMS 3.0 for Windows 英文:SAS 8.0 SPSS 19.0,Statistical Analysis System

22、,Statistical Product and Service Solutions,第三部分 论文写作统计学表达,论著的一般格式(温哥华格式),论文题目,作者,中文摘要,关键词(中文),英文摘要,关键词(英文),导言,对象与方法,结果,讨论,文题,正文,参考文献,1、文题:简明、具体、确切,能概括论文的特定内容。如果应用了先进的设计或统计分析模型可在标题中体现。,例如:中老年人牙齿楔状缺损相关因素的logistic回归分析。,一、科研论文的结构,2、 论文摘要(Abstract):,我国国家级医学期刊一般简化为:目的(objective) 、方法(methods) 、结果(results)

23、、结论(conclusion)四个部分,摘要是论文内容不加注释和评论的简短陈述。作用是不阅读全文即能获得必要的信息。,一、科研论文的结构,目的(objective):简要说明研究的目的、意义及其重要性。方法(methods): 简述本研究的设计方法、研究对象(材料)、实验(试验)方法、研究的范围及观察的指标、资料的收集处理以及统计分析方法等。,一、科研论文的结构,结果(results):简要列出主要的、有意义的、或新发现的研究结果,主要统计量的数值及假设检验结果(P值)。,一、科研论文的结构,肯定经过科学分析的研究结果及其获得的某些结论或论点。一般不涉及统计学。,结论(conclusion):

24、,一、科研论文的结构,4、关键词(key wards):,除非是特殊的统计模型,否则,不用提及统计学术语。,关键词35个。主要是反映论文中的关键性专业术语,以便检索。,3、作者,一、科研论文的结构,导言或引言部分主要是表明研究目的、意义,以及本文所要解决的问题。为了说明本研究的意义,还要概括地叙述一下该研究问题的进展和焦点,进而指出本研究的创新点及其新意。前言部分是要高度概括,画龙点睛,字数不宜太长,少则可在百字内,多则也不要超过500字。,5、导言(introduction),一、科研论文的结构,6、对象与方法(材料与方法 material and methods):,统计描述:描述研究材料

25、的可靠性,专业描述:介绍实验方法,便于别人模仿和重复,一、科研论文的结构,6、对象与方法(1)实验性研究:体现试验设计的“三要素,三原则”。包括以下4个部分:资料来源:介绍研究对象及其可靠性 (对象的选择和诊断及鉴别诊断?有无可比性?)实验方法:具体的实验过程效果评价方法和指标:如何判定结果统计分析方法:软件及统计学方法,一、科研论文的结构,统计分析方法,要包含四层意思:(1)所使用的统计软件(2)数据描述的指标(3)所采用的统计分析方法(4)检验水准,一、科研论文的结构,科研论著的主要结构,一、材料与方法二、结果三、讨论,6、对象与方法(2)观察性研究:调查对象:介绍研究对象及其可靠性调查方

26、法:具体的检测过程及质量控制结果评价方法和指标:如何判定结果统计分析方法:软件及方法,一、科研论文的结构,7、结果(results),主要用统计图表来表示,加上一些分析。,结果是论文的核心部分,需将观察结果或试验结果实事求是地撰写清楚。,一、科研论文的结构,讨论(discussion)是全篇文章的精华,是从理论上对实验和观察结果进行分析和综合,为文章的结论提供理论依据。,8、讨论(discussion),一、科研论文的结构,作者要引用统计结果作为支持其新发现、新结果、新观点的依据。如果对统计结果理解和解释出现偏差,可能导致结论的错误。,8、讨论(discussion),一、科研论文的结构,正确

27、理解差别有无显著性的统计意义,是否拒绝H0,取决于: 1、被研究的事物有无本质的差异 2、抽样误差大小:1)个体差异大小 2)样本例数多少 3、检验水准的高低,8、讨论(discussion),甲组(n=18) 乙组(n=12) P值 XS XS甲指标 3.481.65 4.762.52 0.10乙指标 5.231.12 6.381.21 0.01,两均数相差1.28,两均数相差1.15,8、讨论(discussion),解释,差值大小,抽样误差大小,变异度,例数多少,8、讨论(discussion),8、讨论(discussion),结论不能绝对化,即 拒绝H0, 犯型错误; 不拒绝H0 ,犯型错误。,无论是否拒绝H0,都可能犯错误!,8、讨论(discussion),8、讨论(discussion),型错误与型错误,型错误:拒绝实际上是成立的H0, 这类“弃真”的错误称型错误或第一类错误。其概率大小用表示。,型错误:不拒绝(接受)实际上是不成立的H0, 这类“存伪”的错误称型错误或第二类错误。其概率大小用表示,但一般不知道,即拒绝H0,犯型错误;不拒绝H0 ,犯型错误。,8、讨论(discussion),统计意义和实际意义,有统计学意义,不一定有实际意义!,8、讨论(discussion),8、讨论(discussion),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。