1、第一节统计意义检验的基本步骤,例题,一般认为:健康成年男子的脉搏为72次/分钟。现调查某山区50名健康成年男子的脉搏,得均数75次/分钟,是否说明某山区健康成年男子的脉搏高于一般人?,假设检验的意义,产生差异的原因:1. 抽样误差2. 来自不同的总体,均数的假设检验(hypothesis test of mean),判断样本均数与总体均数之间或样本均数与样本均数之间的差别在统计上有无显著性意义,即这种差别是来自于抽样误差还是本质上存在的方法称为均数的假设检验。常用的检验方法有:t检验、u检验和F检验等。,两个均数假设检验的类型:,1、样本均数与总体均数的比较 (t检验或u检验)2、配对资料的比
2、较(t检验)3、两个样本均数的比较 (t检验或u检验),两均数u检验和t检验的应用条件,一、u检验(u-test)应用条件 1、样本来自正态分布总体; 2、已知; 3、未知,但n足够大(如n100)二、t检验(t-test)应用条件 1、样本来自正态分布总体; 2、未知,n较小; 3、两小样本(n1+n2100) 计算公式: 若 n 较大,则 ,可按算得 的t值用v=查t界值表(t即为u)得P值。,假设检验的基本步骤,1、建立假设,确定单侧检验或是双侧检验H0:无效假设(零假设),差别由抽样误差引起。H1:备择假设,差别是本质上存在的。2、确定检验水准(显著性水准),指进行假设检验发生假阳性的
3、概率,多取0.05。3、根据资料性质及类型,计算样本检验统计量,如计算t、u、x2等统计量。4、根据样本检验统计量,确定概率P。5、结果判断:以检验水准判断H0是否成立,结合专业知识做出结论。,算得的统计量u值与P值 和统计推断结论,0.05 u值 p值 统计推断结论 双侧检验 0.05 不拒绝H0 , 单侧检验 1.645 差异无统计 学意义 双侧检验 1.96 0.05 拒绝H0 ,接受 单侧检验 1.645 H1 ,差异有统 计学意义 双侧检验 2.58 0.01 拒绝H0 ,接受 单侧检验 2.33 H1 ,差异有高 度统计学意义,算得的统计量t值与P值 和统计推断结论,0.05 t值
4、 p值 统计推断结论双侧检验 0.05 不拒绝H0 , 单侧检验 ,按水准,不拒绝H0,无统计学意义,尚不能认为不同或不等。 统计结论只说明有统计学意义或无统计学意义,而不能说明专业上的差异大小。应注意统计学意义与专业意义的区别。,第三节配对样本差值均数的t检验,配对设计的类型,1、异源配对:两个受试对象配成对子,接受不同处理,目的是推断两种处理效果有无差别;2、同源配对(自身配对) 、同一受试对象处理前后的比较,目的是推断这种处理有无作用; 、同一受试对象两个部位,接受相同处理,目的是推断该项处理在两个部位有无差别; 、采自同一受试对象的一个样品分为两份,接受不同处理,目的是推断两种处理效果
5、有无差别。,配对资料的比较(t检验),第四节两样本均数差别的统计意义检验,两样本均数的比较,完全随机设计(completely random design) :把受试对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。 目的:比较两个总体均数是否相同。 条件:假定资料来自正态总体,且12=22,两个样本均数比较的计算公式,(1). t检验适用条件:两个小样本比较,且两样本方差齐同。计算公式:(2). u检验适用条件:两个大样本(n1和n2均50)比较。计算公式:,两大样本均数比较的u 检验,两样本均数比较时,当每组样本量大于50时,可以采用u检验;但只是
6、近似方法。 优点:简单,u界值与自由度无关, u0.051.96, u0.012.58,第五节方差不齐时两样本均数差别的统计意义检验(t检验),两小样本均数的比较 (1).两小样本均数比较的方差齐 性检验 (2).方差齐同:两小样本均数比 较的t检验 (3).方差不齐:两小样本均数比 较的校正t检验(t检验) .n1n2 .n1n2,两小样本均数比较的方差齐性检验,1、建立假设 H0: ,两样本所在的总体方差(相等)。 H1: ,两样本所在的总体方差不等。2、确定检验水准(显著性水准),指进行假设检验时发生假阳性的概率,多取0.05。3、计算检验统计量F F=s2大/s2小4、根据自由度查F值
7、表(方差齐性检验用),结合样本检验统计量F ,确定概率P。5、结果判断:以检验水准及检验统计量F推断H0是否成立,判断两样本方差是否齐同。,两小样本均数比较的校正t检验(t检验)基本步骤,1、建立假设 H0:12 H1:12 2、确定检验水准(显著性水准),指进行假设检验发生假阳性的概率,多取0.05。3、计算样本检验统计量t 4、计算显著性界值t ,结合检验统计量t确定概率P 5、结果判断:以检验水准结合专业知识做出结论。,标准差与均数标准误的区别,标准差( s) 均数标准误概念 描述个体值的变异程度 描述样本均数的变异程度意义 表示一组正态变量值的 表示样本均数抽样误差大 变异程度指标 小
8、的指标 计算公式用途 表示样本均数代表性 表示样本均数的可靠性 描述正态分布资料的 计算总体均数的可信 分布特征 区间 利用正态分布法计算 进行两均数的假设检验 正常值范围 计算变异系数CV和 均数的标准误,第六节两种检验、两类错误及假设检验应注意的问题,双侧检验和单侧检验,事先根据专业知识来确定是采用双侧检验(双尾检验)还是单侧检验(单尾检验),实际工作中较少使用单侧检验。,假设检验中的两类错误 假设检验必须对所检验的假设作出明确的判断。从“拒绝”或“不拒绝”中选择一个较为合理的决定,因此,假设检验结论具有概率性。不论结论是拒绝或者不拒绝H0,都可能犯型错误或者型错误。 当P,结论为按所规定
9、的检验水准,拒绝H0,接受H1。因为现有样本信息不支持H0成立,故拒绝H0。显然,拒绝H0,不能认为H0肯定不成立,有可能犯型错误。 相反,如果P,即样本信息支持H0成立,故不拒绝H0。同样,不拒绝H0,也不能认为H0肯定成立,有可能犯型错误。,I型错误与II型错误示意图(以单侧t检验为例),第一类错误 (type error),第一类错误又称型错误,是指无效假设H0实际上是成立的,但由于抽样误差的偶然性,而得到了较大的t 值(单侧t 检验为例),使观察者按照原来的检验水准拒绝了H0所犯的错误(假阳性错误即“弃真”错误)。型错误的概率用表示,其大小根据研究者的要求来确定,常取0.05。,第二类
10、错误(type error),第二类错误又称型错误,是指无效假设H0实际上是不成立的,但由于抽样误差的偶然性,而得到了较小的t 值(单侧t 检验为例),使观察者按照原来的检验水准接受了H0所犯的错误(假阴性错误即“存伪”错误)。型错误的概率用表示,其大小很难确切估计。,两类错误的关系 1、假设检验中,不可能同时犯两类错误。拒绝H0,只可能犯型错误,不可能犯型错误;不拒绝H0,只可能犯型错误,不可能犯型错误。 2、通常当n固定时, 愈小,愈大;反之愈大,愈小。 3、实际工作中,可根据研究要求适当控制和。若重点在于减少,一般取=0.01;若重点在于减少 ,一般取=0.05。若要同时减小型错误以及型
11、错误,唯一的方法是增加样本含量n。,假设检验时的两类错误,假设检验的结果判断 假设检验 客观实际情况 H0成立 H0不成立 拒绝H0 犯第一类错误() 推断正确(1) 接受H0 推断正确(1) 犯第二类错误()注:,假阳性,以新药疗效为例,会将疗效依旧的一种新药奉为高明的创新而投入生产,无故废弃常规药(在诊断试验中,称为误诊率); ,假阴性,将会埋没效果较好的新药,使其得不到投产利用(在诊断试验中,称为漏诊率); 1,可信度,两总体确无差别,按水准作出无差别推断的概率,即真阴性率(诊断试验中称特异度); 1,把握度,又称检验效能,两总体确有差别,按水准作出有差别推断的概率,即真阳性率(诊断试验
12、中称敏感度)。,进行假设检验应注意的问题,1、 严格实验设计,保证被比较的资料具有可比性;2、 没有意义或没有实用价值的结果不进行假设检验;3、对差别有无显著性意义的判断不能绝对化,显著性 界限是人为规定的界限,统计结论是有概率性的;4、 统计上显著性水平的高低不代表实际差别的大小;5、t检验适用于正态分布的资料,若对数正态分布的 资料,应将变量值变换成对数,在对数条件下作t检 验;6、两小样本均数差异的t检验,事先应进行方差齐性检验,方差齐同时,作t检验;方差不齐时,作t检验;7、根据资料性质和专业知识,选择双侧检验还是单侧 检验;8、报告结论时,应列出样本检验统计量和确切的概率。,第七节正
13、态性检验,正态性检验的方法,1、正态概率纸法:适用于小样本或大样本,方法简便,但有时结果难于判断;2、偏度与峰度检验:可以分别检验分布的偏度和峰度,即了解分布偏离正态分布的类型,但是计算比较繁琐;3、W检验:适用于3n50,且不需要了解偏离正态分布的类型;4、D检验:适用于50n1000,且不需要了解偏离正态分布的类型。,W检验的基本步骤,1、建立假设 H0:无效假设(零假设):资料呈正态分布。 H1:备择假设:资料为非正态分布。2、确定检验水准 多取0.05。3、计算检验统计量W .将观察值由小到大排列,满足x1x2xn .计算W 4、确定概率P值 以W与样本含量n查得的临界值比较,WW时,P 。5、结果判断 以检验水准,结合专业知识做出结论。,D检验的基本步骤,1、建立假设 H0:无效假设(零假设):资料呈正态分布。 H1:备择假设:资料为非正态分布。2、确定检验水准 多取0.05。3、计算检验统计量y .将观察值由小到大排列, 满足x1x2xn .计算y (式中i为观察值序号)4、确定概率P值 以y与样本含量n查得的y的p分位数比较,若取0.05,则以y不在y0.025y0.975范围内为有统计学意义。5、结果判断 以检验水准,结合专业知识做出结论。,