1、宋曼殳首都医科大学公共卫生学院流行病与卫生统计学系,t 检验问题提出,假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同;医疗卫生实践中最常见的是计量资料两组比较的问题;t检验 (t test, student t test)和z检验(z test)是用于计量资料两组比较的最常用的假设检验方法如两种疗法治疗糖尿病的疗效比较,检验与检验 (t test and z test),一、单组样本的t检验二、配对设计计量资料比较的t检验 三、两独立样本资料均数比较的检验四、t检验五、检验,t 检验问题提出,根据研究设计t检验有三种形式:单组(个)样本资
2、料的t检验配对样本均数t检验(非独立两样本均数t检验)两组独立样本均数t检验t检验是以t分布为基础的,第一节单组样本t检验,又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数0的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数0有差别。已知总体均数0一般为标准值、理论值或经大量观察得到的较稳定的指标值。单样t检验的应用条件是总体标准未知的小样本资料(如n t0.01(11), P 0.01, 按0.05的检验水准,拒绝H0,接受H1,可认为差别有统计学意义可认为两种方法皮肤浸润反应结果的差别有统计学意义,t ,t,t 分布曲线,例3: 应用
3、克矽平治疗矽肺患者10名,治疗前后血红蛋白的含量如下表所示,问该药是否引起血红蛋白含量的变化?,配对样本均数t检验检验步骤,自身对比,克矽平治疗矽肺患者治疗前后 血红蛋白含量(g/L) 编号 治疗前 治疗后 1 113 140 2 150 138 3 150 140 4 135 135 5 128 135 6 100 120 7 110 147 8 120 114 9 130 138 10 123 120,治疗矽肺患者血红蛋白量(克) 编号 治疗前 治疗后 治疗前后差数 1 113 140 27 2 150 138 -12 3 150 140 -10 4 135 135 0 5 128 135
4、 7 6 100 120 20 7 110 147 37 8 120 114 -6 9 130 138 8 10 123 120 -3,使用配对检验 解:.建立检验假设,确定检验水准 0:d=0,假设该药不影响血红蛋白的变 化,即治疗前后总体差数为0。 1:d0 ,假设该药影响血红蛋白的变 化,即治疗前后总体差数不为0。 =0.05.,2.计算值,3确定 P 值,作出推断结论 自由度df =10-1= 9 , 查t 临界值(C2,p560)得: 0.20 t t0.05(23),0.01 50),样本均数近似地服从正态分布,故满足成组 t 检验关于正态分布的要求;但当样本例数较小时,如20例,
5、需要对每组资料进行正态性检验。,1、正态性检验,常用的正态性检验方法是矩法检验和 W检验(Shapiro-Wilk W test),矩法检验比较保守,W 检验比较灵敏。此外,还有K-S检验(Kolmogorov-Smirnov test)和D检验(D test)等。无论哪一种正态性检验方法,计算都比较复杂,常借助于软件来实现。,1、正态性检验,正态性检验的无效假设为资料服从正态分布,备择假设为资料不服从正态分布。从例9.1资料的正态性检验结果可知:新药组的正态性检验P0.466,常规药组的正态性检验P0.482,按 的检验水准,均不能拒绝 ,即不拒绝两组资料都服从正态分布的无效假设,可以认为它
6、们都满足正态分布。,两独立样本均数比较的t 检验,要求相应的两总体方差相等,即方差具有齐性。为此,我们要对两样本的方差作统计学检验,2、方差齐性检验,方差齐性的检验 检验F 检验要求资料服从正态分布 检验统计量 值的计算公式为:,2、方差齐性检验,分子 =n11; 分母2 =n21,检验统计量F值为两个样本方差之比,若样本方差的不同仅为抽样误差的影响,F 值一般不会偏离1太远。求得F 值后,查附表C6,p572-577(方差齐性检验用的F界值表)得P值。 取=0.05水准,若FF0.05(,2),P0.05,两总体方差相等若FF0.05(,2), P0.05, 两总体方差不等,2、方差齐性检验
7、,求得值后,其自由度分别为: df1 =n11; df2 =n21查附表C6 ,作方差齐性检验, 若 0.05 则用 t 检验 若 F0.05(11,12),P t,则 P ,t 检验实例分析步骤,建立检验假设,确定检验水准H0:12,即两种饲料小白鼠增重总体均数相同;H1:12,即两种饲料小白鼠增重总体均数不相同;0.05计算检验统计量两总体方差不同,应选用t 检验,t 检验实例分析步骤,确定P值,作出推断结论,先查t界值表 得t0.05(11)2.201,t0.05(12)2.179, 再按公式计算t界限值,t 检验实例分析步骤,确定值 得P 50)时样本均数与总体均数比较、配对设计样本均
8、数比较和两独立样本均数比较的假设检验,可以计算检验统计量z值 标准正态变量z的界值双侧时,单侧时所计算的统计量z值与这些界值比较,很容易确定P值和作出推断结论, 0.05/2= 1.96, 0.01/2 = 2.58, 0.05 = 1.64, 0.01 = 2.33,Z 检验原理,成组设计的两样本均数比较的统计量z值计算中,两均数差的标准误为统计量z值的计算公式为,z,Z 检验实例分析,例: 研究正常人与高血压患者胆固醇含量(mg%)的资料如下,试比较两组血清胆固醇含量有无差别。正常人组 高血压组,Z 检验实例分析步骤,建立检验假设, 确定检验水平,即正常人与高血压患者血清胆固醇值总体均数相
9、同;,即正常人与高血压患者血清胆固醇值总体均数不同;=0.05,双侧。计算统计量z值将已知数据代入公式,得,z,Z 检验实例分析步骤,确定P值, 作出推断结论本例z=10.40 0.01= 2.58,故P50)时或总体标准差已知时,与 0.05/2 = 1.96 进行比较,与 0.05/2 = 1.96 进行比较,两大样本均数的比较,Z 检验 - 小结,第六节 t 检验中的注意事项,1. 假设检验结论正确的前提 作假设检验用的样本资料,必须能代表相应的总体,同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值的专业结论。 这要求有严密的实验设计和抽样设计,如样本是从同质总体中抽取
10、的一个随机样本,试验单位在干预前随机分组,有足够的样本量等。,第六节 t 检验中的注意事项,2. 应根据分析目的、研究设计、资料类型、样本量大小等选用适当的检验方法。 t 检验是以正态分布为基础的,资料的正态性可用正态性检验方法检验予以判断。若资料为非正态分布,可采用数据变换的方法,尝试将资料变换成正态分布资料后进行分析。,检验方法的选择,成组设计两样本均数的比较:t 检验两大样本均数的比较:z 检验(或称u 检验)两样本方差比较:F 检验多个样本均数的比较:方差分析多个样本率的比较:2 检验,第六节 t 检验中的注意事项,3.双侧检验与单侧检验的选择 需根据研究目的和专业知识予以选择。单侧检
11、验和双侧检验中的t值计算过程相同,只是t界值不同,对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择,应在统计分析工作开始之前就决定,若缺乏这方面的依据,一般应选用双侧检验。,第六节 t 检验中的注意事项,4.假设检验的结论不能绝对化 假设检验统计结论的正确性是以概率作保证的,作统计结论时不能绝对化。在报告结论时,最好列出概率 P 的确切数值或给出P值的范围,如写成0.02P0.10,不能认为两总体均数不相等,此时若推断有错,其错误的概率为( )。 A大于0.10 B,而未知 C小于0.10 D1-,而未知某地正常成年男子红细胞的普查结果,均数为480万/mm3,标准差为41.0万/mm3,后者反映( )A个体变异 B抽样误差 C总体均数不同 D均数间变异,是非判断:( )1标准误是一种特殊的标准差,其表示抽样误差的大小。( )2N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。( )3假设检验的目的是要判断两个样本均数的差别有多大。,