1、等级资料的秩和检验,医学统计教研室 荀鹏程,医学研究中的等级资料,疗 效:痊愈、显效、有效、无效、恶化化验结果:、+、+体格发育:下等、中下、中等、中上、上等心功能分级:I、II、III文化程度:小学、中学、大学、研究生营养水平:差、一般、好,等级资料的特点,既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;比“定量”粗,而比一般的“定性”细;等级间既非等距,亦不能度量。,8.1 秩次与秩和,秩次(rank),秩统计量 是指全部观察值按某种顺序排列的位序;秩和(rank sum) 同组秩次之和。,例8.1 编秩,A组: 、+、+、+、+B组: +、+、+、+、+、+,A组:-
2、 + + + +B组: + + + + + +,1 2 3 4 5 7,6 8 9 10 11 12,1 2 4.5 4.5 4.5 8.5,4.5 8.5 8.5 8.5 11.5 11.5,秩和,A组: 、+、+、+、 + 秩和: 1 2 4.5 4.5 4.5 8.5 TA25 B组: +、+、+、+、+、+ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5 TB53,TA+TB=N(N+1)/2=78,秩次:在一定程度上反映了等级的高低;秩和:在一定程度上反映了等级的分布位置。对等级的分析,转化为对秩次的分析。秩和检验就是通过秩次的排列求出秩和,进行假设检验。,8.2 两样本
3、比较的秩和检验,检验假设 H0 :A、B两组等级分布相同; H1 :A、B两组等级分布不同(相互偏离)。 =0.05。,基本思想,如果H0 成立,即两组分布位置相同, 则A组的实际秩和应接近理论秩和n1(N+1)/2; (B组的实际秩和应接近理论秩和n2(N+1)/2)。 或相差不大。如果相差较大,超出了预定的界值,则可认为H0不成立。,A组 B组 和 实际秩和 25 53 78 理论秩和 n1(N+1)/2 n2(N+1)/2 N(N+1)/2 39 39 78差值 14 14 0 抽样误差?如果H0成立,则理论秩和与实际秩和之差纯粹由抽样误差造成。,检验结果,如果H0成立,则按0.05水准
4、, A 组秩和之界值为2652。现A组的实际秩和为25,在界值之外,故拒绝H0,接受H1,认为两组的分布位置不同。,秩和检验的结论判断,A组的实际秩在界值之外,则拒绝H0,接受H1。 (小于或等于下界,大于或等于上界) A组的实际秩在界值之内,则不拒绝H0。 (大于下界且小于上界),某药对两种病情的慢性支气管炎病人的疗效比较,H0 :两型老慢支疗效分布相同;H1 :两型老慢支疗效分布不同。 =0.05。编秩,求秩和 T1 、 T2确定检验统计量T n110或n2-n110时,正态近似法,P0.01,按 =0.05水准,拒绝H0 ,接受H1,差异有统计学意义。可认为复方猪胆胶囊治疗老年性慢性支气
5、管炎喘息型与单纯型的疗效有差别。,8.3 多组比较的秩和检验,Kruskal-Wallis法先对所有数据编秩;求秩和T计算 H 统计量;查 H 界值表,或2界值表,界定 P 值;作出结论。,三种方剂的疗效比较,多组等级比较的检验假设,H0 :各组总体的等级分布相同;H1 :各组总体的等级分布不同或不全相同。 =0.05。,H 的校正与2近似,当有相同秩次时,H 需校正: 当 n 较大时, H 近似服从 = k 1 的 2 分布。 故可按 2 分布获得概率 P,作出统计推断。,三种方剂的疗效比较,H0 :三药疗效总体分布相同;H1 :三药疗效总体分布不同或不全相同。 =0.05。,P=0.000
6、6,8.4 配对符号秩和检验,Wilcoxon符号秩和检验计算等级之差值,对差值绝对值进行编秩,并冠以差值的符号。查 T 界值表,或用近似 u 检验,计算 P 值;界定 P 值,作出结论。,符号秩和检验的假设,H0:差值的总体中位数为0;H1:差值的总体中位数不为0。 =0.05。当n50时,查界值表(附表10)当n50时,用u近似,扁平足疗效例,用配对设计观察两种方法治疗扁平足效果记录如下,问那种方法好。 病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A法 好 好 好 好 差 中 好 好 中 差 好 差 好 中 好 中 B法 差 好 差 中 中 差 中
7、 差 中 差 好 差 中 差 中 差,建立假设H0:两法疗效差值的总体中位数为0;H1:差值的总体中位数不为0。建立检验水准 =0.05,计算检验统计量编秩:求秩和:T=61.5,T=4.5 确定检验统计量T :T或T作为统计量T,界定P 值本例T=61.5,T=4.5,已超出附表10中双侧P0.01相对应的界值561,故得P 0.01。结论按 =0.05水准拒绝H0,接受H1,认为两种方法疗效的总体分布不同。结合资料可认为A法优于B法。,符号秩和检验的基本思想,总秩和为TN(N+1)/2如H0成立,则正负各半,T+ 与 T 均接近 N(N+1)/4。如果相差太大,超出了事先规定的界值, 则H
8、0不成立。,符号秩和检验 T 界值表,N=11 双侧 单侧 1353 0.10 0.05 10 56 0.05 0.025 7 59 0.02 0.01 5 61 0.01 0.005,间距 40 46 52 56,11(11+1)/4=33(理论值),u 的校正,当重复的秩次较多时,u 需要校正:,8.6 秩和检验的正确应用,主要对等级资料进行分析;秩和检验可用于任意分布(distribution free)的资料;T检验与H检验的关系 H检验 T检验 n=2 F检验 t检验,秩和检验用于定量资料,计量资料中: 极度偏态资料,或个别数值偏离过大 各组离散度相差悬殊 资料中含有不确定值 大于5年 0.001 1:1024以上 兼有等级和定量性质的资料,参数检验与非参数检验,在总体的分布类型已知的条件下,对总体的参数进行检验,称为参数检验。在总体的分布类型未知或者不考虑总体的分布的条件下,对总体的分布进行检验,称为非参数检验。适用于任意分布类型的资料,不受总体分布的制约。,成组设计两样本比较,如资料满足 t 检验的条件,应该用 t 检验进行分析。此时,如果对这类资料用Wilcoxon秩和检验,实际上是将观察单位的具体数值舍弃不用,只保留了秩次的信息,使检验功效降低;尤其样本含量较小时,降低更加明显。 如资料不满足 t 检验的条件,而用了t 检验,同样降低了检验效能。,