1、医学统计学(3),季聪华2012.10.11,概率分布参数估计与假设检验EPIDATA数据管理软件,概率分布第一节 正态分布第二节 二项分布和Poisson分布第三节 抽样分布,第一节 正态分布,正态分布是生物医学和统计学上极其重要的一种分布,医学研究的很多指标都服从或近似服从正态分布。在统计学上,很多分布都是由正态分布导出,同时正态分布又是多种分布的极限分布。,一、正态分布的概念,正态分布( normal distribution):是描述连续型随机变量最重要的分布。其分布曲线叫正态分布曲线,呈中间高,两边低,左右基本对称的“钟型”曲线,又称高斯分布(Gauss distribution)。
2、,正态分布由德国数学家 Gauss 在描述误差分布时所发现,并加以推广,所以通常称为高斯分布(Gauss distribution)。,高 斯,10马克的钱币,正态分布的公式,和是正态分布的两个参数,和决定了x的概率分布;习惯上用 N (, 2)表示均数为,标准差为的正态分布。,二、正态分布的特征,(1)集中性:正态分布是一条单峰分布,高峰位置在均数处。 (2)对称性:正态分布以均数为中心,左右完全对称。(3)正态分布曲线的形态取决于两个参数,即总体均数和总体标准差。(4)正态分布曲线下的面积分布具有一定的规律性。,当固定不变时,越大,曲线沿横轴越向右移动;反之, 越小,则曲线沿横轴越向左移动
3、,所以叫正态曲线N(, 2)的位置参数, 。,1. 位置参数:,正态分布位置随参数变换示意图,2. 形状参数:,正态分布形态随参数变换示意图,当固定不变时,越大,曲线越平阔; 越小,曲线越尖峭, 叫正态曲线N(, 2)的形状参数。,三、正态分布面积分布规律,(1)正态分布曲线与横轴所夹面积为1。(2)区间在(-, +)内的面积或概率为0.683,此区间之外概率为0.317,左右两侧各0.1585。(3)区间在(-1.96, +1.96)内的面积或概率为0.95,此区间之外概率为0.05,左右两侧各0.025。(4)区间在(-2.58, +2.58)内的面积或概率为0.99,此区间之外概率为0.
4、01,左右两侧各0.005。,正态分布应用于以下 3 个方面:1.制定医学参考值范围2.质量控制3.统计方法的理论基础,四、正态分布的应用,1.制定医学参考值范围,参考值范围(reference range):指所谓“正常人”的解剖、生理、生化等指标的波动范围。,制定方法:制定参考值范围时,首先要确定一批样本含量足够大的“正常人”。测量样本人群相应指标的值,测量的过程中要严格控制各种误差。而后根据指标的实际用途确定单侧或双侧界值,根据研究目的和使用要求选定适当的百分界值,常用95%。,单侧临界值:标准正态分布单侧尾部面积等于时所对应的正侧变量值,记作Z。,双侧临界值:标准正态分布双侧尾部面积之
5、和等于时所对应的正侧变量值,记作Z/2。,以不同的方法计算参考值范围:,举例1:调查某地120名健康女性血红蛋白,直方图显示其分布近似正态,均数 X =117.4, 标准差S =10.2 ,试估计该地 健康女性血红蛋白的95%参考值范围。,解析:,1. 分布近似正态,2. 过高过低均为异常,3. 求上、下界值,上界:,下界:,所以,该地健康女性血红蛋白的95%参考值范围是(97.41,137.39)g/l。,举例2: 某地调查120名健康成年男性的第一秒肺通气量得均数 X =4.2(L), 标准差S =0.7(L),试据此估计其第一秒肺通气量的95%参考值范围。,解析:,1. 分布近似正态,2
6、. 仅过低为异常,3. 求下界值,下界:,所以,该地健康成年男子第一秒肺通气量的95%参考值范围为不低于3.05(L)。,2.质量控制,基本原理:许多临床检验指标,当影响某一指标的随机因素很多,而每个因素所起的作用均不太大时,这个指标的随机波动属于随机误差,则往往服从正态分布。,质量控制领域的“3原则”:其意义是指正常情况下检测误差服从正态分布,根据正态分布的曲线面积或概率分布理论可知,3之外的观察值出现的概率不到3,如果超过这一值,则提示测量或产品质量有问题。统计学规定:以x为中心线,x2S 为警戒线,x3S为控制线,根据以上的规定还可以绘制出质量控制图。,中心线,警戒线,控制线,控制线,警
7、戒线,3.统计方法的理论基础 t 分布、F 分布、x2分布都是在正态分布的基础上推导出来的,u 检验也是以正态分布为基础的。二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。,第二节 二项分布和Poisson分布,变量类型为二分类时,变量均现为两个对立的可能结果,每个个体的观察结果只能取其中之一,这类变量需按二项分布(binomial distribution)规律进行统计分析。,毒性试验:白鼠 死亡生存临床试验:病人 治愈未愈临床化验:血清 阳性阴性事件 成功(A)失败(非A)这类“成功失败型”试验称为Bernoulli试验。,一、二项分布,(一)二项分布
8、的概念,【例3-1】临床上用针灸治疗某型头痛,有效率为60%,现以该法治疗3例,其中2例有效的概率是多大?,有效的概率是0.6 无效的概率是0.4 3人接受针灸治疗后的有效和无效的所有可能组合,就排列方式而言有8 种;如只计算有效或无效的数目而不考虑其顺序时,则只有 4 种组合。又由于结果是独立的,病例间互不影响,则根据概率的乘法法则可以计算各种排列的连乘概率,再根据概率的加法法则,可以算出无效数或有效数分别为0、1 、2 、3 时的概率。,SPSS计算,(二)二项分布的特征,【例3-2】大样本研究显示,某中药制剂不良反应发生率为5%,现随机抽取5人服用此药,试求:其中m个人(m=0、1、2、
9、3、4、5)有反应的概率。至多有2人有反应的概率。有人有反应的概率。,至多有2人反应的概率: P(X2)=P(0)+P(1) +P(2)有人反应的概率: P(X1)=1-P(0),SPSS计算,PDF.BINOM(m,5,0.05),总体发生率,抽样人数,发生数,PDF.BINOM(quant,n,prob)。数值。返回当每次试验的成功概率是prob 时,n次试验中的成功次数将等于quant的概率。当n为1时,这等同于 PDF.BERNOULLI。,CDF.BINOM(m,5,0.05),总体发生率,抽样人数,发生数,CDF.BINOM(quant,n,prob)。数值。返回n次试验(每次成功
10、的概率为prob)中成功次数将小于等于quant的累积概率。当n为1时,这等同于 CDF.BERNOULLI。,3、二项分布的图形和正态近似,(1)二项分布的图形:如果已知n和,则按二项分布概率公式可计算出不同的X取值时的概率,我们可以用X为横轴,取值概率 P为纵轴,可绘制出二项分布的图形。不难发现,二项分布的图形是一个离散型分布,其形状决定于两个参数n和,当为0.5时,图形对称;当不等于0.5时,图形呈偏态,但当样本量增大时,图形逐渐趋于对称。,SPSS演示二项分布图概念,(2)二项分布的正态近似:根据统计学上的中心极限定理,当n较大,且n与n(1-)较接近时,二项分布将接近于正态分布。当n
11、趋向无穷大时,二项分布B(n,)的极限分布就是正态分布Nn,n(1-)。一般地说,如果n与n(1-)大于5时,即可用正态分布近似原理处理二项分布问题,以简化计算。,(三)二项分布的应用,在应用二项分布时,必须注意其应用条件:(1)二项分布中的观察单位数通常是事先确定的。(2)各观察单位只有互相对立的两种结果,如成功与失败、生存和死亡等。(3)若两种对立结果中的一种结果(阳性)的概率为,则其对立结果的概率为1-。实际工作中总体概率往往是未知的,但可以从大量观察中获得的比较稳定的样本频率作为总体概率的估计值。(4)n个观察单位的观察结果相互独立。即观察单位之间发现的结果不能互相影响,如要求疾病无传
12、染性、无家族聚集性。,【例 3 -3】大样本调查显示,新生儿畸形发生率为1%,现随机调查某地 500 名新生儿,其中只有1例发生畸形,问该地新生儿畸形发生率是否低于一般。,首先计算500名新生儿发生1例畸形的概率 P(X1)= P(0)+ P(1)=0.0398说明当地至多发生1例畸形的概率是0.0398,小于0.05,是小概率事件。所以可以认为当地新生儿畸形发生率不等于1%。互相之间的高与低,通过1/500=0.00250时,可按近似正态原理计算可信区间,公式为:,【例4-7】用计数器测得某放射性物质10分钟内发出的脉冲数为500,求每10分钟脉冲计数的总体均数的95%可信区间。,第二节 假
13、设检验,一、假设检验的基本思想假设检验(hypothesis testing)又称显著性检验(significance test),其基本思想是:先提出两总体相等的假设,然后看实际抽到的样本与已知总体差异是否属小概率事件(p0.05),若不属小概率事件则接受原假设,若属小概率事件则拒绝原假设。,二、假设检验步骤,1.建立假设、确定检验水准(1)零假设或无效假设: H0:=0,即两总体均数相同。(2)备择假设或有统计学意义假设H1:0,即两总体均数不同。根据专业知识及数据特征,备择假设H1 也有单侧形式:0 。选择双侧检验,还是单侧检验需依据数据特征和专业知识进行确定。,2.选择检验方法、计算统
14、计量假设检验的方法应针对不同研究目的、设计及资料的类型选定,并计算相应的检验统计量。如在总体方差已知的情况下,进行两均数的比较用z检验或u检验;在总体方差未知情况下,进行两均数的比较用 t 检验等。,3.确定P值、作出推论根据计算的检验统计量,确定P值,P值是在H0成立的情况下随机抽样,获得大于及等于或(和)小于及等于现有样本资料求得的检验统计量的概率。,三、假设检验的两类错误,假设检验可帮助我们判断两总体与0是否相等的问题。但无论是接受H0或拒绝H0(接受H1)的统计推断,都有一定程度上犯错误的可能,常概括为第一类错误和第二类错误(或称I型错误和II型错误)。,1.I型错误(type I e
15、rror) 用表示,是指H0原本是正确的,但正确的H0被拒绝(接受H1)所犯的错误称为I型错误,故又称假阳性率、误诊率,即弃真错误。也就是说,当定为小概率0.05时,如H0 原本正确,即两总体参数相同,那么在100次抽样推断中有95次的可能会接受H0的正确判断,也会有5次的可能会拒绝H0的不正确判断,这就是允许犯I型错误的概率为0.05,即=0.05。必要时也可取= 0.01或=0.10。,2.II型错误(type II err)用表示,是指H0原本是不正确的,但错误的H0被接受了所犯的错误称为II型错误,故又称假阴性率、漏诊率,即取伪错误。也就是说,当定为0.10时,如H0原本不正确,即两总
16、体参数不同,那么在100次抽样推断中有 90次的可能会拒绝H0接受H1的正确判断,也有10 次的可能会接受H0的不正确判断,这就是允许犯 II型错误的概率为0.10,即=0.10。根据专业需要或研究性质不同也可取=0.20。,接受 Ho,真实,Ho 对,Ho 错,I类错误 (-风险),II类错误 (-风险),正确,正确,拒绝 Ho,3 .检验效能( power of test )(1) 1-表示 H 0原本成立,按检验水准和样本信息作出接受H 0正确判断的能力,称可信度。(2) 1-表示H0原本不成立,按检验水准和样本信息作出接受H1正确判断的能力,称为检验效能或把握度。当=0.10,此时检验
17、效能为0.9或90%。,4.检验效能(把握度)的影响因素(1)总体参数间差异越大,检验效能越高或把握度越大。因|-0|越大,得到|x-0|越大的概率越高,同时增大拒绝H0接受H1的机会。(2)个体差异或标准差越小,检验效能越高或把握度越大。因标准差与标准误成正比,而与检验统计量z成反比。(3)样本含量n越大,检验效能越高或把握度越大。因标准误与标准差成正比而与n成反比。(4)检验水准越大,检验效能越高或把握度越大。因为n一定时,与呈反向变化,增大,减小,1-增大,故增大可提高检验效能。,四、假设检验的注意事项,1.严密的抽样设计差异比较是建立在同质基础上的,同质是假设检验的前提条件,实际上就是
18、要保证样本或比较组间的均衡可比性,即要求除了对比的因素外,其它影响结果的因素应尽可能相同或基本相近。其具体实施方法是严格做到随机抽样和控制混杂因素,严密科研设计和抽样设计。2.检验方法的选择各种类别的假设检验和检验统计量的方法很多,因此所选用的检验方法必须符合其适用条件。这些条件主要包括研究目的、设计方法、资料类型、样本含量等。,3.P值的大小并不表示实际差别的大小若 P,则拒绝H0接受H1,这只说明|- 0|0,并不能根据P值的大小判别与0或x与0 之间的具体差别大小;P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越小,与|-0|或|x-0|的大小无关。如P0.01比P0.05更
19、有理由拒绝H0,接受H1,并不表示P0.01时,与0或x与0之间实际差别比P0.05时与0或x与0之间实际差别更大。,4.假设检验的推断结论不能绝对化(1)假设检验中是否接受H0不仅决定于总体间是否相同,而且与抽样误差的大小、样本例数的多少、检验水准的高低以及单双侧检验都有关。(2)若统计结论和专业结论一致,则最终结论也一致;若统计结论和专业结论不一致,则最终结论需根据专业知识而定。判断被试因素的有效性时,要求在统计上和专业上都有意义。,5.可信区间与假设检验的关系统计推断中的可信区间估计与假设检验的具体含义、思路和作用各有不同,但目的一致,相互补充,尤其在统计检验方面有异曲同工或相互验证的功
20、效。(1)可信区间兼具参数估计和假设检验双重功效,(2)可信区间比假设检验有可能提供更多信息之处: 可信区间不但能回答差别有无统计学意义,还能提示差别有无实际意义。,-均有统计学意义,其中:提示既有统计学意义又有实际意义。提示有统计学意义,也可能有实际意义。提示仅有统计学意义,而无实际意义。、均无统计学意义,其中:可信区间包含有实际意义的界值和H0,提示可能样本太小,抽样误差太大,以下但包含H0,提示既无统计学意义,也无实际意义。尚难作出结论。可信区间的上限在有实际意义的界值以下但包含H0,提示既无统计学意义,也无实际意义。,(3)可信区间不能完全取代假设检验可信区间用作假设检验只能在规定的水
21、准上揭示差异有无统计学意义。而不能象假设检验那样得到精确的概率p。所以,把可信区间与假设检验结合起来,互相补充,才是完整的分析。因此在结果报告时,同时显示假设检验的检验统计量值、P值和可信区间的信息为宜。,参数估计,假设检验,五、假设检验的分类,根据是否正态分布:分参数检验和非参数检验根据处理因素:分单因素分析和多因素分析根据比较类型:分优效性、等效性和非劣效性。,六、常用假设检验方法的选择,多因素分析,一般方法:判别分析、聚类分析、主成分分析、因子分析、典型相关分析回归分析:直线回归、多元回归、逐步回归曲线拟合与非线性回归:曲线拟合、Cox 回归、 Logistic 回归,六、常用假设检验方
22、法的选择,六、常用假设检验方法的选择,第三节 正态性检验与变量转换,一、正态性检验有些统计方法只适用于正态分布或近似正态分布资料,如用均数和标准差描述数值资料的集中或离散情况、用正态分布法确定正常值范围、t检验与F检验等,因此在用这些方法前,需考虑资料是否服从正态分布。这可以通过我们已有的经验或正态性检验来判断。,(一)医药研究经验以经验来决定资料是否服从正态分布,尤其对小样本资料(n20)有着重要的作用。 (二)正态性检验(test of normality),二、数据转换,数据转换(data conversion)是将数据从一种表现形式变为另一种表现形式的过程,目的都是为了使数据符合统计检
23、验方法的应用条件。常用的数据转换方法如下:1.对数变换(Iogarithmic transformation)将原始数据变量x的对数值作为新的分析变量,适用于对数正态分布资料。常用于:使服从对数正态分布的资料正态化。使资料达到方差齐性要求,特别是各样本的变异系数比较接近时。使曲线直线化。,2.平方根变换将原始数据变量 x 的平方根作为新的分析变量。常用于:轻度偏态资料正态化。观察值服从 Poisson 分布的计数资料。当各样本的方差与均数呈正相关时,均数大,方差也大,用此变换可使资料达到方差齐的要求。,3.平方根反正弦变换,4.倒数变换,EPIDATA数据管理软件,数据管理的一种常用软件,Ep
24、iData 特点,简单易学、实用性强对计算机硬件要求不高CRF设计便捷与CRF形式一致的可视数据录入界面数据核查功能强大且实现简便 数据转换功能强大单机 适合小型临床研究、流行病学调查等,EpiData 语言设置,EpiData文件组成,EpiData Entry由3 种基本文件组成:调查表文件(.QES文件),它的作用是定义调查表(CRF)的结构,即录入界面格式。数据文件(.REC文件),所有录入的数据就存在这个文件之中。数据录入核查文件(.CHK文件),定义字段输入数据的有效性。,EpiData的数据库特点,EpiData记录数最好不要超过200,000300,000。设计录入界面时整个录入界面不能超过999行。(EXCEL为230、FOXPRO为256),EpiData数据管理流程,建立调查表文件,创建数据库,建立核查文件,录入数据,数据库管理,输出数据,EpiData的主界面,CRF(病例报告表)设计,字段名:a 字段类型:文本、数字、日期等字段长度字段编辑器,建立数据库,数据核查,允许录入的范围,跳转,是否必须录入,定位字段位置,数据录入,打开数据库文件,数据录入,数据查找,数据处理一致性检验,数据合并,数据转换,数据转换,谢谢!,