1、,第九章 基于秩次的非参数检验,参数:描述总体特征的指标参数统计:许多统计推断方法,要求来自总体分布类型是已知的,在这种假设基础上,对总体进行统计推断(进行估计和检验)称为参数统计。非参数检验:不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验的方法称为非参数检验。,以特定的总体分布为前提,各种检验方法的条件 t检验 Z检验 方差分析 2检验,非参数统计的适用条件:,1.分布类型未知/不明2.分布不对称或无法转化成正态分布资料3.方差明显不齐又无适当变换方法达到方差齐性的资料4.等级(有序)资料5.一端或两端观察值不确切的资料6.出现少量异常值的小样本数据,参数与非参数检验区别,参数检
2、验所检验的是参数非参数检验检验的是分布,非参检验的优缺点:,优点: 1.计算简单便于掌握。 2.应用范围广。 3.收集资料方便。缺点: 1.适用于参数检验的资料用 非参数检验时降低检验效能。 2.犯第二类错误的概率加大。,非参数检验方法种类,秩和检验 游程检验 序贯检验 2 检 验,第一节 单样本资料和配对设计的 符号秩和检验,一、一组样本资料的符号秩和检验二、配对设计资料的符号秩和检验,例10-1 已知某地正常人尿氟含量中位数为2.15mmol/L。今在该地某厂随机抽取12名工人测得尿氟含量(mmol/L),结果见表9-1。问该厂工人的尿氟含量是否高于当地正常人?,表10112名工人尿氟含量
3、(mmol/L)测定结果,检验步骤:1.假设: H0:差值总体中位数Md=0 H1: Md0 =0.052.求差值:见表10-13.编秩:依差值绝对值由小到大编秩遇差值为0舍去不计,n随之减少。差值绝对值相等,若符号不同,求平均秩次;若符号相同,可顺次编秩,也可求平均秩次。最后将各秩次冠以原差值的正负号。,表9112名工人尿氟含量(mmol/L)测定结果,检验步骤:4.求秩和并确定检验统计量:分别求正负秩次之和,正秩次的和以T+表示,负秩次的和以T-表示.本例T+为62.5,T-为3.5,以绝对值较小秩和作检验统计量,本例取T=3.5。5.确定P值并做出推断结论: 5n50 查表法(附表9 p
4、483) n 50 正态近似法 / 校正,查表法自左侧找到n,用所得统计量T与相邻一栏界值比较 T值在上下界值范围内P上方相应概率 T值恰好等于界值 P或=上方相应概率 T值在上下界值范围外P 上方相应概率,再 右移一栏做比较,直至较好地估计出P值本例查T界值表,得P50,T分布逐渐逼近均数为n(n+1)/4,方差为N(n+1)(2n+1)/4的正态分布,可用正态近似法进行分析。,若多次出现相持现象,用下式计算:,式中tj:第j个相同差值的个数,假定差值中有2个4,5 个6,3个7则t1=2, t2=5,t3=3,第一节 配对设计和单样本资料的 符号秩和检验,一、一组样本资料的符号秩和检验二、
5、配对设计资料的符号秩和检验,例9-2 对9个水样分别用重量法和EDTA法测定硫酸盐含量,结果见表9-2,问两法测定结果有无差别。,表92两种方法测定水中硫酸盐的含量比较(mmol/L),基本思想: 假定两种处理效应相同,则差值的总体分布是对称的,总体中位数为0。 若此假设成立,样本差值的正秩和与负秩和应相差不大,均接近n(n+1)/4;当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H0。,检验步骤:1.建立假设 H0:差值总体中位数Md=0 H1: Md0 =0.052.根据差值编秩:按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为0,
6、舍去不计;若差值的绝对值相等时取平均秩次。,表93两种方法测定水中硫酸盐的含量比较(mmol/L),检验步骤:3.求秩和并确定检验统计量:分别求出正、负差 值秩次之和,以T+和 T-表示 ,单侧检验时任取其一为统计量T;双侧检验时,以绝对值较小者为统计量T。 本题取T+=12, T-=24,n=8,取T=12或244.确定P值作结论 :5n50 查表法(p483) n 50 正态近似法 / 校正,本例n=8 T=12或24 查附表9得双侧P0.1,按=0.05水准,不拒绝H0,可以认为两方法测定结果无差别。,第二节 两独立样本比较的秩和检验,一、两组连续性变量资料的秩和检验二、两组有序分类变量
7、资料的秩和检验,例9-3 某地职业病防治研究欲比较使用二巯丁二钠与二巯基丙磺酸钠的驱汞比值,并将结果列于表9-4?,表9-4 两种驱汞药排汞比较,两组独立样本比较的秩和检验适用于:完全随机设计两样本资料的比较可用于:分布偏态或方差不齐的定量资料比较单向有序资料或无法精确测量的资料的比较,目的:推断两个独立样本分别代表的总体分布是否有差别基本思想: 假设两总体分布相同,两样本可认为是从同一总体中抽取的随机样本;将二者混合后由小到大编秩,然后分别计算两样本组的平均秩和应大致相等,其差别由随机抽样引起;如果按上法计算的两样本平均秩和差别很大,就有理由认为H0不成立。,秩和检验对两个总体分布形状的差别
8、不敏感,对位置相同、形状不同但类似的两总体分布,推断不出两总体分布(形状)有差别,故对立的备择假设H1不能为两总体分布不同,而只能为两总体分布位置不同。 实际应用中检验假设H0可写两总体分布位置相同,也可简化为两总体中位数相等。,1.建立假设 H0:两种药物排汞比值的总体分布位置相同 H1:两种药物排汞比值的总体分布位置不同 =0.052.编秩:将两组数据由小到大统一编秩,如遇有相同数据,同一组内可顺次编秩,不同组时取平均秩次。3.求秩和并确定检验统计量:两组秩次分别相加得出秩和。当样本例数不等时,以样本例数小的那个组的秩次之和为统计量T,当两组样本例数相等时,可任取一组的秩次之和为统计量T.
9、本例二巯丁二酸组样本例数为10,二巯基丙磺酸钠组的样本例数为12,检验统计量T=75.5.4.确定P值和作出推断结论:查表法 (附表10) 正态近似法 /校正,正态近似法如果n110或n2- n110,超出附表10范围,可按正态近似计算Z值,本例n1=10,n2-n1=2,查T界值表(成组设计用),概率为双侧0.05对应的T界值为84-146,T=75.5并未超出该范围,故P0.05,按=0.05水准,拒绝H0,可以认为两种药物排汞比值效果有差别。依平均秩次,第二组驱汞效果好于第一组。,第二节 完全随机设计两组独立样本秩和检验,一、定量变量两组独立样本的秩和检验二、有序分类变量两组独立样本的秩
10、和检验,例9-4 某研究者欲评价新药按摩乐口服液治疗高甘油三酯血症的疗效,将高甘油三酯血症患者189例随机分为两组,分别用按摩乐口服液和山楂精降脂片治疗,数据如表9-4,问两药物治疗高甘油三酯血症的疗效有无不同?,表9-4 两种药物治疗甘油三酯血症的疗效,1.假设:H0:两组药物总体分布相同 H1:两组药物总体分布不相同 =0.052.编秩:先按组段计算各等级的合计人数,由此确定各等级秩次范围,然后计算出各等级的平均秩次。3.求秩和并确定检验统计量:以各等级的平均秩次分别与每组各等级例数相乘,再求秩和。4.确定P值和作出推断结论:查表法 (p484) 正态近似法/校正,表9-4 两种药物治疗甘
11、油三酯血症的疗效,本例n1=69,超出T界值表可查范围,采用正态近似检验,查t界值表(附表2,=时)得P0.05。按照=0.05水准,拒绝H0,接受H1,故可认为两药物治疗高甘油三酯血症的疗效不同。,一、定量变量多组独立样本的秩和检验二、有序变量多组独立样本的秩和检验,第三节 完全随机设计多组独立样本秩和检验,例9-5 某研究者欲研究A、B两菌种对小鼠巨噬功能的激活作用,将60只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬功能的监测方法,获得三组的吞噬指数,试比较三组吞噬指数有无差别?,表9-5 不同菌种对小鼠巨噬细胞的吞噬指数,(1)假设:H0:三个总体分布相同 H1:三个总体分布
12、不同或不全相同 =0.05(2)编秩:将各组数据混合,由小到大排列并编秩,如遇相同数值,同一组内可顺次编秩,不同组时取平均秩。(3)求秩和:分别将各组秩次相加,求出各组秩和。(4)计算检验统计量,各组秩和,(5)确定P值和作出推断结论查表法 (p485)若组数k=3,每组例数小于等于5时,可查H界值表得出P值2 检验若最小样本数大于5时,或组数大于3时则H分布近似服从=k-1卡方分布,查卡方界值表,得出P值,H值的校正:,=3-1=2 查卡方界值表,得出P0.05。按=0.05检验水准,拒绝H0.可以认为不同菌种对小鼠巨噬细胞的吞噬指数的作用不同。,一、定量变量多组独立样本的秩和检验二、有序变
13、量多组独立样本的秩和检验,第三节 完全随机设计多组独立样本秩和检验,例9-6 四种病人痰液内嗜酸性粒细胞的检查结果见表96。问四种疾病患者痰液内嗜酸粒细胞的等级有无差别?,1 建立假设2 编秩:先按组段计算各等级的合计人数,由此 确定各等级秩次范围,然后计算出各等 级的平均秩次。3 求秩和 : 以各等级的平均秩次分别与每组各等 级例数相乘,再求秩和。 计算检验统计量H值/校正H值4 确定P值作结论: 查表法(p485) 2 检验,本例k=4,H分布近似服从=4-1=3的卡方分布,查卡方界值表,得出P0.05,按照=0.05水准,拒绝H0,接受H1,故可认为四种疾病患者痰液内嗜酸粒细胞的等级有差
14、别,第四节 随机区组设计资料的秩和检验,例9-7 欲用学生的综合评分来评价四种教学方式的不同,按照年龄、性别、年级、社会经济、地位、学习动机相同和智力水平、学习情况相近作为配对条件,将4名学生分一组,共8组,每区组的4名学生随机分到四种不同的教学实验组,经相同的一段时间后,测得学习成绩的综合评分,试比较四种教学方式对学习成绩的综合评分影响有无不同?,表9-7 不同区组4种教学方式对学生学习综合评分比较,基本思想: 各区组内的观察值按从小到大的顺序进行编秩;如果各处理的效应相同,各区组内秩1,2,k应以相等的概率出现在各处理中,各处理组的秩和应该大致相等,不太可能出现较大差别。如果按上法所得各处
15、理样本秩和相差很大,便有理由怀疑各处理组的总体分布不同。,检验步骤:1 编秩:先将各区组内数据由小到大编秩,遇相同数值 取平均秩次。2 将各处理组的秩次相加,得到各处理组秩和Ri。3 求平均秩:4 计算统计量M值 :5 确定P值作结论: 查表法(p453) 近似2 检验,第五节 多个样本两两比较秩和检验,无论是对完全随机设计多个样本比较,还是对随机化区组设计的多个样本比较,当经过多个样本比较的秩和检验拒绝H0,认为各总体分布位置不同或不全相同时,常需作两两比较的秩和检验是否相同,以判断哪两个总体分布相同,哪两个总体分布不同。,一、完全随机设计多个样本间的多重比较,以例9-5说明对完全随机设计资
16、料进行多重比较的步骤1、检验假设H0:第i组与第j组所代表的总体中位数相同H1:第i组与第j组所代表的总体中位数不相同2、计算检验统计量并确定P值 设Ri和Rj分别为比较的第i组和第j组样本的秩和,其平均秩和分别为,1)精确法:样本含量较小时,采用两样本秩和检验的方法,求得统计量的数值后,求相应概率值。2)正态近似法:样本含量较大时,计算统计量:,3、做出统计推断结论 将某两组比较所得P值与调整以后的检验水准 比较,若P ,则拒绝H0。4、检验水准的调整通常有两种情况:1)多组间的两两比较2)实验组与同一对照组的比较,保证第一类错误的概率总共不超过,表9-5的资料进行两两比较,按=0.05总的
17、检验水准,每次比较必须采用调整的检验水准 表9-8 三组样本秩和的两两比较,二、随机区组设计多个样本间的多重比较,通过例9-7说明基本方法和步骤:,1、检验假设H0:任两组学习成绩综合评分总体中位数相同H1:任两组学习成绩综合评分总体中位数不相同2、计算检验统计量并确定P值 设Ri和Rj分别为比较的第i组和第j组样本的秩和,其平均秩和分别为,1)精确法:样本含量较小时,采用两样本秩和检验的方法,求得统计量的数值后,求相应概率值。2)正态近似法:样本含量较大时,计算统计量:,3、做出统计推断结论 将某两组比较所得P值与调整以后的检验水准 比较,若P ,则拒绝H0。4、检验水准的调整通常有两种情况:1)多组间的两两比较2)实验组与同一对照组的比较,表9-7的资料进行两两比较,按=0.05总的检验水准,每次比较必须采用调整的检验水准,表9-9 不同教学方式间的两两比较,秩和检验是将原始数据转换成秩次,比较各组秩和的非参数检验。不同设计类型的秩和检验其编秩、求秩和、计算统计量、确定P值的方法有所不同。注意编秩时的平均秩次,以及相持现象较多时统计量的校正。,表9-10 本章不同设计类型的秩和检验与相对应的参数检验,