1、,第九章 非参数检验,(nonparametric test),2,检验方法的选择及应用条件,t 检 验:u 检 验:方差分析:,3,参数检验:若样本所来自的总体为分布已知的数学形式(如正态分布),对其总体参数进行假设检验,则称为参数检验。,分析目的:对总体参数( )进行估计或检验。分 布:要求总体分布已知,如: 连续性资料 正态分布 计 数 资 料二项分布、POISSON分布等统 计 量:有明确的理论依据(t分布、u分布)有严格的适用条件,如:正态分布 Normal总体方差齐 Equal Variance数据间相互独立 Independent,参数检验的特点:,条件不满足时采用非参数统计的方
2、法。,非参数检验:对总体分布不做严格假定,也不对总体参数进行统计推断,而是直接对总体分布的位置进行假设检验。由于这类方法不受总体参数的限制,故称非参数检验,又称任意分布检验(distribution-free test), 总体分布形式未知或分布类型不明;, 偏态分布的资料(非正态分布的资料):, 等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示 单向有序行列表资料, 不满足参数检验条件的资料:各组方差明显不齐。, 数据一端或两端是不确定数值, (必选)如“50kg”等。,非参数检验适用范围:,单向有序RC表 有两种形式。一种是表中的分组变量(如年龄)是有序的,而指标变量(如传
3、染病的类型)是无序的,其研究目的通常是分析不同年龄组各种传染病的构成情况,可用行列表资料的2检验进行分析;而如果指标变量为二分类,如右上表,想分析是否随工龄增加患病率也增加可以考虑线性趋势检验;另一种情况是表中的分组变量(如疗法)为无序的,而指标变量(如疗效按等级分组)是有序的,如右下表,其研究目的为比较不同疗法的疗效,宜用秩和检验进行分析,双向有序属性相同的RC表 表中的两分类变量皆为有序且属性相同。实际上是22配对设计的扩展,即水平数3的诊断试验配伍设计,如用两种检测方法同时对同一批样品的测定结果。其研究目的通常是分析两种检测方法的一致性,此时宜用一致性检验(或称Kappa检验),双向有序
4、属性不同的RC表 RC表中两分类变量皆为有序的,但属性不同,如下表;对于该类资料,若研究目的为分析不同年龄组患者混浊度之间有无差别时,可把它视为单向有序RC表资料,选用秩和检验;若研究目的为分析两有序分类变量间是否存在相关关系,宜用等级相关分析;若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用线性趋势检验,非参数检验的优缺点:,优点:适用范围广对数据要求不严方法简便、易于理解和掌握缺点:损失信息、检验效能低,注 意:,凡符合或经过变换后符合参数检验条件的资料,最好用参数检验。当资料不具备参数检验的条件时,非参数检验是一种有效的分析方法。,注:对符合用参数检验的资料,如用非参数检验,会
5、丢失信息,导致检验效率下降,犯类错误的可能性比参数检验大。,参数检验与非参数检验比较,本章介绍的非参数统计方法均基于秩次;秩次(rank):将数值变量值从小到大,或等级变量值从弱到强所排列的序号。秩和:用秩次号代替原始数据后,所得某些秩次号之和,即按某种顺序排列的序号之和,称为秩和。,秩次和秩和,例1 设有以下两组数据: A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7 两组各有5个变量值。现在依从小到大的顺序将它们排列起来,并标明秩次,结果如下:A组 2.6 3.2 4.7 5.2 6.4 B组 1.7 2.3 2.6 3.6 3.7秩次 1 2 3
6、.5 3.5 5 6 7 8 9 10,秩次和秩和,秩次和秩和,原始值中有两个“2.6”,分属A、B组,计算它们的平均数(3+4)/2=3.5,作为“2.6”的秩次,称为“平均秩次” 。这样两组所得的秩次及秩和如下: A组 3.5 5 8 9 10 /35.5 B组 1 2 3.5 6 7 /19.5,秩和检验,又称秩转换的非参数检验将变量值从小到大或从弱到强转换成秩后再计算检验统计量,从而推断一个总体表达分布位置的中位数M和已知M0、两个或多个总体的分布是否不同特点:对总体分布的形状差别不敏感,只对总体分布的位置差别敏感,(Rank sum test),秩和检验,适用资料类型:计量、等级资料
7、基本思想:基于秩次(通过编秩,用秩次代替原始数据信息来进行检验)即检验各组的平均秩是否相等。如果经检验得各组的平均秩不相等,则可以推论数据的分布不同,进一步可推论各分布间分布位置发生了平移。,内容提要:,配对样本比较的Wilcoxon符号秩检验两独立样本比较的Wilcoxon秩和检验完全随机设计多个样本比较的Krusk秩和检验,第一节 配对样本比较的Wilcoxon符号秩检验,由Wilcoxon于1945年提出又称 Wilcoxon 符号秩和检验适用条件:1、差值不服从正态分布 2、等级资料常用于检验差值的总体中位数是否等于零单个样本中位数和总体中位数比较配对样本差值的中位数和0比较,一、一组
8、样本资料与总体中位数比较的 符号秩和检验: Wilcoxon signed-rank test 例 已知某地正常人尿铅含量的中位数为2.5mol/L。今在该地随机抽取16名工人,测定尿铅含量见表10-1第(2)栏。问该厂工人的尿铅含量是否高于当地正常人?,假设检验的步骤为:建立检验假设,确定检验水准:H0:差值的总体中位数Md=0; H1:差值的总体中位数Md0; =0.05,单侧2. 确定检验方法,计算检验统计: Wilcoxon signed-rank test. T值。(1)求差值:di=Xi-M0;(2)编秩:按差值符号分为两列(3)确定统计量T:T=28。3. 确定P值,作出统计推断
9、:,(1) 查表法:当对子数5 n50时,根据对子数n查附表9 T界值表(配对比较的符号秩和检验用)。 若T0.05,LT T0.05,U,则P0.05; 若TT0.05,L,或TT0.05,U,则P0.05。本例T=28,单侧概率为0.05对应的范围为35-101,得P50时,在无效假设条件下有:,如多次出现有相等秩次时,须用校正公式。设出现第j(j=1,2,)次相等秩次中所包含的秩次个数为tj ,如tj=2表示有2个相等秩次, tj=3表示有3个相等秩次。校正公式,例9-1 对9个水样分别用重量法和EDTA法测定硫酸盐含量,结果见表9-1,这两种方法的测定结果有无差别?,二、配对设计资料的
10、符号秩和检验,建立检验假设,确定检验水准:H0:差值的总体中位数Md=0;H1:差值的总体中位数Md0; =0.05,双侧概率2. 确定检验方法,计算检验统计量: Wilcoxon signed-rank test.检验统计量为T值。(1)求每对差值:di将差值列入表9-1第4列;(2)编秩:按差值的绝对值由小到大编秩,并将秩次按差值的符号分为两列栏(见表9-1第5、6列)。,注意:编秩时,遇有绝对值相等、符号相反的差值时,各取平均秩次;当差值为0时,不计秩次,但对子数n要相应地减去差值中0的个数。,(3) 确定统计量T:分别求正、负秩次之和,以绝对值较小者为统计量T,即T=min(T+,T-
11、)。本例T =12。3. 确定概率P值,作出统计推断:本例n=9,查表得(840), T0.05,L=8,T0.05,U=40,T T0.05,L,故P0.05,按=0.05检验水准不拒绝H0,差别无统计学意义,尚不能认为两法测定结果有差别。,例 对28名患有轻度牙周疾病的成年人,指导他们实行良好达到口腔卫生习惯,6个月后,牙周情况好转程度依高到低给予分数+3,+2,+1;牙周情况变差程度依次给予分数-1,-2,-3;没有变化给予0分,试对该项指导结果进行评价, 建立假设 H0:差值总体中位数为0 H1:差值总体中位数不为0; =0.05 计算统计量,假设检验步骤, 查表与结论 查T界值表,T
12、0.05(23)=73203,T=91,在界值范围内,P0.05,不拒绝H0,认为指导后牙周状况无显著好转,第二节两组独立样本的秩和检验一、两组连续性变量资料资料的秩和检验 Wilcoxon rank sum test for continuous data 例9-2 某地职业病防治研究欲比较使用二巯丁二钠与二巯基丙磺酸钠的驱汞的排汞比值,结果见表9-2。问题:这两种药物驱汞的效果有无差别?,1. 建立检验假设,确定检验水准:H0:两种药物驱汞的效果的总体中位数相同;H1:两种药物驱汞的效果的总体分布中位数不相=0.05,双测检验2. 确定检验方法,计算检验统计量: Wilcoxon rank
13、 sum test. T值。(1)编秩:将两组数据由小到大统一编秩。两组有相同数据时取平均秩;(2)分组求秩和。(3)确定统计量T:若两组例数相等,取任一组的秩和为T。 若两组例数不等,取例数较小组的秩和为T。 本例T=75.5或T=177.5。,3. 确定P值,作出统计推断:(1) 查表法。查附表10 T界值表(两样本比较的秩和检验用)按双侧(n1=10、n2-n1=5)格子第二行的值为84145:(T0.05,L- T0.05,U)。本例75.584, 故在=0.05水平上拒绝H0, 差别有统计学意义,可以认为两种药物驱汞的效果的效果有差别。,(2) 正态近似法:当n1或n2-n1超出了附
14、表10的范围时应用。 a. 当无相等或相等情况不多时用(9-3)式:,b. 当相等秩的情况较多(如超过25%)时用校正公式(10-6)式:,二、两组有序变量资料的秩和检验 Wilcoxon rank sum test for ordinal data 例9-4 某研究为研究两种药物治疗尖锐湿疣疗效,分别用5%咪喹莫特软膏和氟尿嘧啶软膏治疗尖锐湿疣,结果见表9-4 第(1)(2)(3)栏。,问题:两种药物治疗尖锐湿疣的疗效有无差别?,假设检验的步骤为:建立检验假设,确定检验水准: H0:两治疗组疗效的相同; H1:两治疗组疗效不相同; =0.05,双侧检验2. 确定检验方法,计算检验统计量:Wi
15、lcoxon rank sum test for ordinal data. T统计量。(1)编秩:按合计的等级例数累计排序、编秩及平均秩(3,4,5列),(2)求分组秩和:按组的各等级例数平均秩次之和。 以较少例数组的秩和为T,本例为T(n=262)=17045.0。(3)计算Z值:用公式(9-3)和(9-4),3. 确定P值,作出统计推断:Z=1.2421.96,P0.05在=0.05水平上不拒绝H0, 差别无统计学意义,尚不能认为两种药物治疗尖锐湿疣的疗效有差别。,第三节多组独立样本的秩和检验一、多组连续性变量资料的秩和检验 Kruskal-Wallis H test for conti
16、nuous data 例9-5 某医院用3种不同方法治疗15例胰腺癌患者,每种方法各治疗5例。治疗后生存月数见表9-5第(1)(3)(5)栏。,问题:这3种方法对胰腺癌患者的疗效有无差别?,表9-5 3种方法治疗胰腺癌患者的生存月数比较,假设检验的步骤如下:1. 建立检验假设,确定检验水准: H0: 三个总体的分布位置相同; H1:三个总体的分布位置不全相同; =0.05,双测检验,2. 确定检验方法,计算检验统计量: Kruskal-Wallis H 检验。(1)编秩:将各组数据混合后由小到大统一编秩。有相同数据时取平均秩;(2)分组求秩和。 R1=34,R2=60,R3=26,(3)计算统
17、计量H:,当相等秩的情况较多(如超过25%)时用校正公式(9-6)式:,3. 确定P值,作出统计推断:(1) 查H表。附表11 H界值表(三样本比较的秩和检验用)。 适用于k=3, N 15, ni5。 本例K=3,且各级组例数均为5,由H界值表查得临界值5.78,P0.05,拒绝H0,接受H1,故可认为3种方法对胰腺癌患者的疗效有差别。(2) 卡方近似法:当组数或各组例数超出H界值表时,由于H0成立时H值近似地服从=K-1的X2分布,此时可由X2界值表得到P值。,二、多组有序变量资料的秩和检验 Kruskal-Wallis H test for ordinal data 例9-6 某医院用3
18、种方法治疗慢性喉炎,结果见表9-6第(1)(4)栏。问题:这3种方法的疗效是否有差别?,假设检验的步骤为:建立检验假设,确定检验水准:H0:3种方法疗效的总体中位数相同H1:3种方法疗效的总体中位数不相同或不全相同=0.05,双侧检验,2. 确定检验方法,计算检验统计量: H test. H统计量。(1)编秩:按合计的等级例数累计排序、编秩及平均秩(6,7列)(2)求分组秩和:按组的各等级例数平均秩次之和,3. 确定P值,作出统计推断:(1) 卡方近似法:20.05,2=5.9951.41, P0.05, 在=0.05水平上拒绝H0,差别有统计学意义,可以认为3种方法的疗效有差别。,(3)计算
19、检验统计量H值:用公式(9-5)和(9-6),第五节、 样本间两两比较的秩和检验,9-12,例9-7 续例9-6,进一步作两两比较。1、建立假设H0:第i组与第j组疗效的总体分布位置相同H1:第i组与第j组疗效的总体分布位置不相同=0.052、计算,表9-7 表9-6资料两两比较的秩和检验,3、确定P值,判断结果 根据各对比组的t值及自由度=N-K=478-3=475,查t界值表得出P值,见表9-7第六栏。按=0.05水准,除了1组与3组比较,不拒绝H0,即除乙法与丙法二者无差别,其余每二者间均有差别,可认为甲法优于乙、丙法。,多个样本间的多重比较(两两比较,p. 183)精确法:Fisher
20、 精确概率法。用于多组的情形。(2)正态近似法:当N较大时计算标准正态差Z值:,当相等秩的情况较多时用校正公式(10-18)式:,(3) 检验水准的调整(Bonferroni 法):k个样本反复两两比较时,每次比较所用调整类错误概率的计算公式:a. 多组间所有组合的两两比较: b. 各实验组与对照组比较:,(附)第四节随机区组设计资料的秩和检验一、总体比较;Friedman test 或M test 例10-7 评价四种不同教学方式的教学效果。每4名学生组成一个区组。随机分配到不同教学方式组中。共12个区组。资料见表10-7。(组数:k=4,总例数:N=412=60)。下标符号:区组号:i,
21、i=1,2,n;本例n=12. 处理组号:j,j=1,2,k;本例k=4.,假设检验的步骤如下:1. 建立检验假设,确定检验水准: H0: 三个总体的分布相同; H1:三个总体的分布不同或不全相同; =0.05,双侧检验,2. 确定检验方法, 计算检验统计量: Friedman 秩和检验. M统计量(1)编秩:按区组由小到大排序、编秩,相同值取平均秩;(2)按处理组分组求秩和:Ri:R1=12, R2=15, R3=23.5, R4=20.5.,(3)计算统计量M:,本例 =(12+15+23.5+29.5)/4=20.0,得到M统计量为;,3. 确定P值,作出统计推断:(1) 查表法(当区组
22、数n15,k 15时):附表12 M界值表(随机区组比较的秩和检验用,P=0.05),有M0.05(8,4)=105191.5,P0.05. 按=0.05水平拒绝H0,认为四种教育方式对学生的学习综合评分的影响有统计学意义。(2) 卡方近似法:用于资料不满足M界值表的要求时。计算步骤为:,求总秩和:,求第j处理组的期望秩和Rj与方差2Rj:在H0成立条件下有:,计算每一组的标准正态差Zj:,计算卡方统计量:,(10-14)式的进一步简化公式为:,本例区组数n=8, 处理组数k=4, R1=12, R2=15, R3= 23.5, R4= 29.5,查卡方界值表:20.05,3=7.8114.36, P10,n2n110时采用Z检验,这时的检验是属于参数检验还是非参数检验,为什么?,专题讨论,配对比较的假设检验,符合参数检验的条件,宜用什么方法?能否出现t检验的结果P0.05,而非参数检验结果P0.05?如果出现了以上的情况,此时应该怎样解释检验结果?,思考与练习题(共4题)(in pages 191-192)第6,8,9,10 题,The end,