1、u 检验、t 检验、F 检验、X2 检验 (转) 来源: 李冠炜的日志 常用显著性检验 1. t 检验 适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配 对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。 2. t检验 应用条件与 t 检验大致相同,但 t检验用于两组间方差不齐时,t检验 的计算公式实际上是方差不齐时 t 检验的校正公式。 3. U 检验 应用条件与 t 检验基本一致,只是当大样本时用 U 检验,而小样本时则用 t 检验,t 检验可以代替 U 检验。 4.方差分析 用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样 本均数比较及
2、双因素分组的多个样本均数的比较,方差分析首先是比较各组间 总的差异,如总差异有显著性,再进行组间的两两比较,组间比较用 q 检验或 LST 检验等。 5. X2 检验 是计数资料主要的显著性检验方法。用于两个或多个百分比(率)的比较。 常见以下几种情况:四格表资料、配对资料、多于 2 行*2 列资料及组内分组 X2 检验。 6.零反应检验 用于计数资料。是当实验组或对照组中出现概率为 0 或 100时,X2 检验 的一种特殊形式。属于直接概率计算法。 7.符号检验、秩和检验和 Ridit 检验 三者均属非参数统计方法,共同特点是简便、快捷、实用。可用于各种非 正态分布的资料、未知分布资料及半定
3、量资料的分析。其主要缺点是容易丢失 数据中包含的信息。所以凡是正态分布或可通过数据转换成正态分布者尽量不 用这些方法。 8. Hotelling 检验 用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。 计量经济学检验方法讨论 计量经济学中的检验方法多种多样,而且在不同的假设前提之下,使 用的检验统计量不同,在这里我论述几种比较常见的方法。 在 讨论不同的检验之前,我们必须知道为什么要检验,到底检验什么? 如果这个问题都不知道,那么我觉得我们很荒谬或者说是很模式化。 检验的含义是要确实因果关 系,计量经济学的核心是要说因果关系是 怎么样的。那么如果两个东西之间没有什么因果联系,那么我
4、们寻找 的原因就不对。那么这样的结果是没有什么意义的,或 者说是意义不 大的。那么检验对于我们确认结果非常的重要,也是评价我们的结果 是否拥有价值的关键因素。所以要做统计检验。 t 检验,t 检验主要是检验单个 ols 估计值或者说是参数估计值的显著 性,什么是显著性?也就是给定一个容忍程度,一个我们可以犯错误 的限度,错误分为两 类:1、本来是错的但是我们认为是对的。2、本 来是对的我们认为是错的。统计的检验主要是针对第一种错误而言的。 一般的计量经济学中的这个容忍程度是 5%,也就是说可以容忍我们范 第一类错误的概率是 5%。这样说不准确,但是比较好理解。t-stastic 是类似标准正态
5、化的正态分布两一样,也就是估计 值减去假设值除以 估计值得标准差,一般假设值是 0,这一点不难理解,如果是 0 ,那 么也就意味着没有因果关系。这个 t-static 在经典假设之下服从 t 分 布。t 分布一般是和正态分布差不多,尤其是当样本的量足够大的时候, 一般的经 验认为在样本数量大于 120 的时候,就可以看成是正态分布 的。 F-statistc:F 检验是属于联合检验比较重要的一种,主要的目的是用 于对于一系列的原因的是否会产生结果这样一个命题做出的检验。F 统 计量主要的产生来源是 SSRSSTSSE 三个量。但是这个检验有一个缺 点是必须在经典假设之下才能有效。 LM 检验:
6、这个检验的性质和 F 检验的性质是一样的,都是检验联合显 著性的,不同的是 F 统计量符合 F 分布,但是 LM 统计量服从卡方分布。 卡方分布是正态分布的变 量的平方和,而 F 分布是卡方分布的商,并 且分子和分布必须独立,这就是为什么 F 检验适用范围受限的原因。 LM=n*SSR、或者是 LM=n-SSR。 至于其他的 White 检验、Brusch-pagan 检验(异方差的检验方法)、 还有序列相关的 t 检验、DW 检验基本原来是相同的。 关于异方差检验、序列相关的检验其中存在不同的地方,但是思想基 本是相同的。 关于异方差检验的讨论: 1、Brusch-pagan 检验:这个检验
7、的思路比较简单,主要是要研究残查 和 X 之间的关系,给定这样的一个方程:u=b0+b1*x1+bn*xn+u 的回归,其中进行 F 检验和 LM 检验。如果检验通过那么不存在异方差, 如果不通过那么存在异方差。 2、 White 检验:这个检验也是对异方差的检验,但是这个检验不同的 是不仅对于 X 的一次方进行回归,而且考虑到残查和 x 的平方还有 Xi*Xj 之间的关系。给 定如下方程:u=b0+b1*y+b2*y2+u。也是用 F 和 LM 联合检验来检验显著性。如果通过那么不存在异方差,否则存在。 序列相关的检验方法的讨论: 对 于时间序列的问需要知道一个东西,也就是一介自回归过程,也
8、就 是一般在教科书中说到的:AR(1)过程,其中的道理主要是说在当期的 变量主要是取决于过去 一个时期的变量和一个随机误差项。表示如下: Ut=p*U(t-1)+et。在这里我要说到几个概念问题,I(1)(一阶积整)、 I(0)(零阶积整)。 其中的一介自回归过程 AR(1)就属于零阶积整过 程,而一阶积整过程实际上是随机游动和飘移的随机游动过程。随机 游动过程:Ut=U(t-1)+et。也 就是在 AR(1)的过程之下,其中的 P 是 等于 1 的。飘移的随机游动过程:Ut=a+U(t-1)+et。其中随机游动过 程和 AR(1)过程中的不同点在于 一个弱相依性的强弱问题,实际上我 们在时间
9、序列问题中,我们可以认为任何一个过程是弱相依的,但是 问题的关键是我们不知道到底有多弱?或者更加直观地说, 我们想知 道 P 到底是多大,如果 P 是 0.9 或者是一个比较接近于 1 得数,那么 可能我们可以认为这个时间序列有高度持久性,这个概念表示当期的 变量却绝于一个 很早的时期的变量,比如一阶积整过程,实际上 et 是一个独立统分布的变量,而且条件数学期望等于 0,没有异方差性。 那么实际上这个序列的数学期望是和期数 没有什么关系的。那么也就 意味着从第 0 期开始,U 的数学期望值就是和很久以后的 U 的数学期望 值一样的。但是方差就不同了,方差随着时间的增加不断扩大。我 们 知道了
10、,这种不同的概念就可以讨论在一阶自回归的条件之下的检验 问题,但是我们说一介自回归的过程是参差序列的特征而已,其他的 变量的特征问题我们不 谈。 在讨论检验的问题以前,我有必要交待一下时间序列在 ols 估计的时 候我们应该注意什么。实际上解决序列自相关问题最主要的问题就是 一个差分的方法。因为如果是长期持久的序列或者是不是长期持久的 序列,那么一定的差分就可以解除这种问题。 1、 t 检验。如果我们知道这个变量是一个一介自回归的过程,如果我 们知道自回归过程是 AR(1)的。那么我们就可以这样作,首先我们做 OLS 估计,得到的参差 序列我们认为是一阶自相关的。那么为了验证 这种情况,那么我
11、们可以做 Ut 和 U(t-1)的回归,当然这里可以包含一 个截距项。那么我们验证其中的参数的估 计是不是显著的,就用 t 检 验。 t 检验与 F 检验有什么区别 1.检验有单样本 t 检验,配对 t 检验和两样本 t 检验。 单样本 t 检验:是用样本均数代表的未知总体均数和已知总体均数进行比较, 来观察此组样本与总体的差异性。 配对 t 检验:是采用配对设计方法观察以下几种情形, 1,两个同质受试对象分别接受两种不同的处理; 2,同一受试对象接受两种不同的处理; 3,同一受试对象处理前后。 F 检验又叫方差齐性检验。在两样本 t 检验中要用到 F 检验。从两研究总体中 随机抽取样本,要对
12、这两个样本进行比较的时候,首先要判断两总体方差是否 相同,即方 差齐性。若两总体方差相等,则直接用 t 检验,若不等,可采用 t检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可 以用 F 检验。 2.t 检验和方差分析的前提条件及应用误区用于比较均值的 t 检验可以分成三 类, 第一类是针对单组设计定量资料的; 第二类是针对配对设计定量资料的; 第三类则是针对成组设计定量资料的。 后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的 特征相似配成对子。无论哪种类型的 t 检验,都必须在满足特定的前提条件下 应用才是合理的。 若是单组设计,必须给出一个标准值或总
13、体均值,同时,提供一组定量的观测 结果,应用 t 检验的前提条件就是该组资料必须服从正态分布;若是配对设计, 每对数据的差值必须服从正态分布; 若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足 方差齐性。 之所以需要这些前提条件,是因为必须在这样的前提下所计算出的 t 统计量才 服从 t 分布,而 t 检验正是以 t 分布作为其理论依据的检验方法。 值得注 意的是,方差分析与成组设计 t 检验的前提条件是相同的,即正态性和方差齐 性。 t 检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料 的假设检验方法。t 检验得到如此广泛的应用,究其原因,不外乎以下几点
14、: 现有的医学 期刊多在统计学方面作出了要求,研究结论需要统计学支持;传统 的医学统计教学都把 t 检验作为假设检验的入门方法进行介绍,使之成为广大 医学研究人员最熟悉 的方法;t 检验方法简单,其结果便于解释。简单、熟悉 加上外界的要求,促成了 t 检验的流行。但是,由于某些人对该方法理解得不 全面,导致在应用过程中出现 不少问题,有些甚至是非常严重的错误,直接影 响到结论的可靠性。将这些问题归类,可大致概括为以下两种情况: 不考虑 t 检验的应用前提,对两组的比较一律用 t 检验; 将各种实验设计类型一律视为多个单因素两水平设计,多次用 t 检验进行均值 之间的两两比较。 以上两种情况,均
15、不同程度地增加了得出错误结论的风险。而且,在实验因素 的个数大于等于 2 时,无法研究实验因素之间的交互作用的大小。 u 检验和 t 检验区别与联系 u 检验和 t 检验可用于样本均数与总体均数的比较以及两样本均数的比较。理 论上要求样本来自正态分布总体。但在实用时,只要样本例数 n 较大,或 n 小 但总体标准 差 已知时,就可应用 u 检验;n 小且总体标准差 未知时,可 应用 t 检验,但要求样本来自正态分布总体。两样本均数比较时还要求两总体 方差相等。 一、样本均数与总体均数比较 比较的目的是推断样本所代表的未知总体均数 与已知总体均数 0 有无差别。 通常把理论值、标准值或经大量调查
16、所得的稳定值作为 0.根据样本例数 n 大 小和总体标准差 是否已知选用 u 检验或 t 检验。 (一)u 检验用于 已知或 未知但 n 足够大用样本标准差 s 作为 的估计 值,代入式(19.6)时。 以算得的统计量 u,按表 19-3 所示关系作判断。 表 19-3 u 值、P 值与统计结论 t值 P 值 统计结论 0.05 双侧 单侧 1.96 1.645 0.05 不拒绝 H0,差别无统计学意义 0.05 双侧 单侧 1.96 1.645 0.05 拒绝 H0,接受 H1,差别有统计学意义 0.01 双侧 单侧 2.58 2.33 0.01 拒绝 H0,接受 H1,差别有高度统计学意义
17、 例 19.3 根据大量调查,已知健康成年男子脉搏均数为 72 次/分,标准差为 6.0 次/分。某医生在山区随机抽查 25 名健康成年男子,求得其脉搏均数为 74.2 次 /分,能否据此认为山区成年男子的脉搏高于一般? 据题意,可把大量调查所得的均数 72 次/分与标准差 6.0 次/分看作为总体均数 0 和总体标准差 ,样本均数 x 为 74.2 次/分,样本例数 n 为 25. H0: =0 H1: 0 =0.05(单侧检验) 算得的统计量 u=1.8331.645,P0.05,按 =0.05 检验水准拒绝 H0,可认 为该山区健康成年男子的脉搏高于一般。 (二)t 检验用于 未知且 n
18、 较小时。 以算得的统计量 t,按表 19-4 所示关系作判断。 表 19-4 t值、P 值与统计结论 t值 P 值 统计结论 0.05 t0.05(v) 0.05 不拒绝 H0,差别无统计学意义 0.05 t0.05(v) 0.05 拒绝 H0,接受 H1,差别有统计学意义 0.01 t0.01(v) 0.01 拒绝 H0,接受 H1,差别有高度统计学意义 例 19.4 若例 19.3 中总体标准差 未知,但样本标准差已求出,s=6.5 次/分, 余数据同例 19.3. 据题意,与例 19.3 不同之处在于 未知,可用 t 检验。 H0: =0 H1: 0 =0.05(单侧检验) 本例自由度
19、 v=25-1=24,查 t 界值表(单侧)(附表 19-1)得 t0.05(24) =1.711.算得的统计量 t=1.6921.711,P0.05,按 =0.05 检验水准不拒绝 H0,尚不能认为该山区成年男子的脉搏高于一般。 二、配对资料的比较 在 医学研究中,常用配对设计。配对设计主要有四种情况:同一受试对象处 理前后的数据;同一受试对象两个部位的数据;同一样品用两种方法(仪 器等)检验 的结果;配对的两个受试对象分别接受两种处理后的数据。情况 的目的是推断其处理有无作用;情况、的目的是推断两种处理(方 法等)的结果有无差 别。 公式(19.8) 式中,0 为差数年总体均数,因为假设处
20、理前后或两法无差别,则其差数的均数 应为 0,d 为一组成对数据之差 d(简称差数)的均数,其计算公式同式 (18.1);Sd 为差数均数的标准误,sd 为差数年的标准差,计算公式同式 (18.3);n 为对子数。 因计算的统计量是 t,按表 19-4 所示关系作判断。 例 19.5 应用某药治疗 9 例高血压病人,治疗前后舒张压如表 19-5,试问用药 前后舒张压有无变化? 表 19-5 高血压病人用某药治疗前后的舒张压(kPa) 病人编号 治疗前 治疗后 差数 d D2 1 12.8 11.7 1.0 1.21 2 13.1 13.1 0.0 0.00 3 14.9 14.4 0.5 0.
21、25 4 14.4 13.6 0.8 0.64 5 13.6 13.1 0.5 0.25 6 13.1 13.3 -0.2 0.04 7 13.3 12.8 0.5 0.25 8 14.1 13.6 0.5 0.25 9 13.3 12.3 1.0 1.00 合计 4.7 3.89 H0:该药治疗前后的舒张压无变化,即 d=0 H1:该药治疗前后的舒张压有变化,即 d0 =0.05 自由度 v=n-1=8,查 t 界值表得 t0.05(8)=2.306,t0.01(8)=3.355,本例 t=3.714t0.01(8),P0.01,按 =0.05 检验水准拒绝 H0,接受 H1,可认 为治疗前
22、后舒张压有变化,即该药有降压作用。 三、完全随机设计的两样本均数的比较 亦称成组比较。目的是推断两样本各自代表的总体均数 1 与 2 是否相等。 根据样本含量 n 的大小,分 u 检验与 t 检验。 (一)u 检验可用于两样本含量 n1、n2、均足够大时,如均大于 50 或 100. 公式(19.9) 算得的统计量为 u 值,按表 19-3 所示关系作出判断。 例 19.6 某地抽样调查了部分健康成人红细胞数,其中男性 360 人,均数为 4.6601012/L,标准差为 0.5751012/L;女性 255 人,均数为 4.1781012/L,标准差为 0.2911012/L,试问该地男、女
23、红细胞数的均数有 无差别? H0: =0 H1: 0 =0.05 今 x1=4.6601012/L,s1=0.5751012/L,n1=360; x2=4.1781012/L,s2=0.2911012/L,n2=255. 算得的 u=13.632.58,P0.01,按 =0.05 检验水准拒绝 H0,接受 H1,可 认为该地男女红细胞数的均数不同,男性高于女性。 (二)t 检验可用于两样本含量 n1、n2 较小时,且要求两总体方差相等,即方 差齐(homoscedasticity)。若被检验的两样本方差相差较大且差别有统计学 意义则需用 t 检验。 公式(19.10) 公式(19.11) 公式
24、(19.12) 式中 sx1x2,为两样本均数之差的标准误,s2c 为合并估计方差(combined estimate variance)。算得的统计量为 t,按表 19-4 所示关系作出判断。 例 19.7 某医生统广西瑶族和侗族正常妇女骨盆 X 线测量资料各 50 例。骨盆入 口前后径:瑶族的均数为 12.002(cm),标准差 0.948(cm),侗族相应的为 11.456(cm)和 1.215(cm)。问两族妇女的骨盆入口前后径是否有差别? H0: 1=2 H1: 12 =0.05 已知 n1=n2=50, x1=12.002(cm),s1=0.948(cm); x2=11.456(c
25、m),s2=1.215(cm)。 本 例自由度 v =n1+n2-2=98,查 t 界值表表内自由度一栏无 98,可用内插法 (从略)或用 v =100 估计.T0.05(100)=1948,t0.01(100)=2.626,今 t=2.505t0.05(1000,P0.05,按 =0.05 检验水准拒绝 H0,接受 H1,可 认为广西瑶族和侗族妇女骨盆入口前后径不同,前者大于后者。 四、完全随机设计的两样本几何均数比较 医学上有些资料为等比资料或正态分布资料,宜用几何均数表示其平均水平。 比较两样本几何均数的目的是推断它们分别代表的总体几何均数是否相等。此 种情况下,应先把原始数据 X 进行
26、对数变换,用变换后的数据代入式(19.10)、 (19.11)、(19.12)计算 t 值。 例 19.8 将 20 名钩端螺旋体病人的血清随机分为两组,分别用标准株或水生株 作凝溶试验,测得稀释倍数如下,问两组的平均效价有无差别? X1:标准株(11 人) 100,200,400,400,400,400,800,1600,1600,1600,3200 X2:水生珠(9 人)100,100,100,200,200,200,200,400,400 H0: 1=2 H1: 12 =0.05 将两组数据分别取对数,以对数作为新变量 X1 和 X2. X1:2.000,2.301,2.602,2.60
27、2,2.602,2.602,2.903,3.204,3.204,3. 204,3.505 X2: 2.000,2.000,2.000,2.301,2.301,2.301,2.301,2.602,2.602 方差分析与两样本 T 检验区别 用变换后的数据计算 x1,s12;x2,s22 再代入式(19.10)、(19.11)、 (19.12)计算 t 值。 x1=2.794,s12=0.2043;x2=2.268,s22=0.0554 自由度 v=11+9-2=18,查 t 界值表得 t0.01(18)=2.878,今 t=3.1502.878,P0.01,按 =0.05 检验水准拒绝 H0,接
28、受 H1,可认为两 组平均效价不同,标准株高于水生株。 方差分析与两样本 T 检验。 1。首先可以看到方差分析(ANOVA)包含两样本 T 检验,把两样本 T 检验作为 自己的特例。 因为 ANOVA 可以比较多个总体的均值,当然包含两个总体作为特例。实际上,T 的平方就是 F 统计量(m 个自由度的 T 分布之平方恰为自由度为(1,m)的 F 分布。因此,这时候二者检验效果完全相同。T 检验和 ANOVA 检验对于所要求 的条件也相同: 1)各个组的样本数据内部要相互独立, 2)各组皆要正态分布 3)各总体的方差相等。 上述这 3 个条件完全相同。 2。如果说要指出差别,则区别仅在下列一点上
29、: 用 ANOVA 检验两总体均值相等性时,只限于这样的双侧检验问题,即: H0:mu1=MU2 Ha:mu1 not= mu2 而两样本的 T 检验则可以比上述情况更广泛,对立假设可以是下面 3 种中的任 何一种. Ha:mu1 mu2 Ha:mu1 mu2 Ha:mu1 not= mu2 这样说来,两样本均值相等性检验虽然可以用 ANOVA 做, 但这没有任何好处, 反而使得对立假设受到限制,因而还是 T 检验更好。 其他表述: t 检验与方差分析,主要差异在于,t 检验一般使用在单样本或双样本的检验,方 差分析用于 2 个样本以上的总体均值的检验.同样,双样本也可以使用方差分析, 多样本
30、也可以使用 t 检验,不过,t 检验只能是所有总体两两检验而已. 两 种方法与样本量没有直接关系,而是与数据的分布有关系,如果数据是正态分 布的,那不管是小样本或大样本,利用莱维-林德伯格中心极限定理的原理,都是 可以 用的,如果数据非正态分布,那只能使用大样本利用李雅普诺夫中心极限定 理的原理进行 2t 检验,此时不能利用方差分析,因为方差分析三个条件之一就是 正态分 布. T 检验及其与方差分析的区别 假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差 异来推断他们相应的总体参数是否相同。 t 检验: 1.单因素设计的小样本( n50)计量资料 2.样本来自正态分布总体
31、3.总体标准差未知 4.两样本均数比较时,要求两样本相应的总体方差相等 根据研究设计 t 检验可由三种形式: 单个样本的 t 检验 配对样本均数 t 检验(非独立两样本均数 t 检验) 两个独立样本均数 t 检验 (1)单个样本 t 检验 又称单样本均数 t 检验(one sample t test),适用于样本均数与已知总体均 数 0的比较,其比较目的是检验样本均数所代表的总体均数 是否与已知总 体均数 0有差别。 已知总体均数 0一般为标准值、理论值或经大量观察得到的较稳定的指标 值。 单样 t 检验的应用条件是总体标准 s 未知的小样本资料( 如 n50),且服从正 态分布。 (2)配对
32、样本均数 t 检验 配对样本均数 t 检验简称配对 t 检验(paired t test),又称非独立两样本均 数 t 检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本 均数所代表的未知总体均数是否有差别。 配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子, 每对中的两个个体随机地给予两种处理。 应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。 配对设计处理分配方式主要有三种情况: 两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物 配成一对,或把同性别和年龄相近的相同病情病人配成一对; 同一受试对象或同一
33、标本的两个部分,随机分配接受两种不同处理,如例 5.2 资料; 自身对比(self-contrast)。即将同一受试对象处理(实验或治疗)前后的结 果进行比较,如对高血压患者治疗前后、运动员体育运动前后的某一生理指标 进行比较。 (3)两独立样本 t 检验 两独立样本 t 检验(two independent samples t-test),又称成组 t 检验。 适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的 均数是否相等。 完全随机设计是将受试对象随机地分配到两组中,每组对象分别接受不同的 处理,分析比较处理的效应。或分别从不同总体中随机抽样进行研究。 两独立样本 t
34、检验要求两样本所代表的总体服从正态分布 N( 1, 12)和 N( 2, 22),且两总体方差 12、 22相等,即方差齐性(homogeneity of variance, homoscedasticity)。 若两总体方差不等,即方差不齐,可采用 t检验,或进行变量变换,或用秩和 检验方法处理。 t 检验中的注意事项 1. 假 设检验结论正确的前提 作假设检验用的样本资料,必须能代表相应的总 体,同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值 的专业结 论。这要求有严密的实验设计和抽样设计,如样本是从同质总体中抽 取的一个随机样本,试验单位在干预前随机分组,有足够的样本
35、量等。 2. 检验方法的选用及其适用条件,应根据分析目的、研究设计、资料类型、样 本量大小等选用适当的检验方法。 t 检验是以正态分布为基础的,资料的正态 性可用正态性检验方法检验予以判断。若资料为非正态分布,可采用数据变换 的方法,尝试将资料变换成正态分布资料后进行分析。 3. 双侧检验与单侧检验的选择 需根据研究目的和专业知识予以选择。单侧检 验和双侧检验中的 t 值计算过程相同,只是 t 界值不同,对同一资料作单侧检 验更容易获得显著的结果。单双侧检验的选择,应在统计分析工作开始之前就 决定,若缺乏这方面的依据,一般应选用双侧检验。 4. 假设检验的结论不能绝对化 假设检验统计结论的正确
36、性是以概率作保证的, 作统计结论时不能绝对化。在报告结论时,最好列出概率 P 的确切数值或给出 P 值的范围,如写成 0.02P0.05,同时应注明采用的是单侧检验还是双侧检验, 以便读者与同类研究进行比较。当 P 接近临界值时,下结论应慎重。 5正确理解 P 值的统计意义 P 是指在无效假设 H0 的总体中进行随机抽样,所 观察到的等于或大于现有统计量值的概率。其推断的基础是小概率事件的原理, 即概率很小的事件在一次抽样研究中几乎是不可能发生的,如发生则拒绝 H0。 因此,只能说明统计学意义的“显著” 。 6假设检验和可信区间的关系 假设检验用以推断总体均数间是否相同,而可 信区间则用于估计
37、总体均数所在的范围,两者既有联系又有区别。 T 检验属于均值分析,它是用来检验两类母体均值是否相等。均值分析是来考 察不同样本之间是否存在差异,而方差分析则是评估不同样本之间的差异是否 由某个因素起主要作用。 T 检验及其与方差分析的区别 假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差 异来推断他们相应的总体参数是否相同。 t 检验: 1.单因素设计的小样本( n50)计量资料 2.样本来自正态分布总体 3.总体标准差未知 4.两样本均数比较时,要求两样本相应的总体方差相等 根据研究设计 t 检验可由三种形式: 单个样本的 t 检验 配对样本均数 t 检验(非独立两样本均
38、数 t 检验) 两个独立样本均数 t 检验 (1)单个样本 t 检验 又称单样本均数 t 检验(one sample t test),适用于样本均数与已知总体均 数 0的比较,其比较目的是检验样本均数所代表的总体均数 是否与已知总 体均数 0有差别。 已知总体均数 0一般为标准值、理论值或经大量观察得到的较稳定的指标 值。 单样 t 检验的应用条件是总体标准 s 未知的小样本资料( 如 n50),且服从正 态分布。 (2)配对样本均数 t 检验 配对样本均数 t 检验简称配对 t 检验(paired t test),又称非独立两样本均 数 t 检验,适用于配对设计计量资料均数的比较,其比较目的
39、是检验两相关样本 均数所代表的未知总体均数是否有差别。 配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子, 每对中的两个个体随机地给予两种处理。 应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。 配对设计处理分配方式主要有三种情况: 两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物 配成一对,或把同性别和年龄相近的相同病情病人配成一对; 同一受试对象或同一标本的两个部分,随机分配接受两种不同处理,如例 5.2 资料; 自身对比(self-contrast)。即将同一受试对象处理(实验或治疗)前后的结 果进行比较,如对高血压
40、患者治疗前后、运动员体育运动前后的某一生理指标 进行比较。 (3)两独立样本 t 检验 两独立样本 t 检验(two independent samples t-test),又称成组 t 检验。 适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的 均数是否相等。 完全随机设计是将受试对象随机地分配到两组中,每组对象分别接受不同的 处理,分析比较处理的效应。或分别从不同总体中随机抽样进行研究。 两独立样本 t 检验要求两样本所代表的总体服从正态分布 N( 1, 12)和 N( 2, 22),且两总体方差 12、 22相等,即方差齐性(homogeneity of varianc
41、e, homoscedasticity)。 若两总体方差不等,即方差不齐,可采用 t检验,或进行变量变换,或用秩和 检验方法处理。 t 检验中的注意事项 1. 假 设检验结论正确的前提 作假设检验用的样本资料,必须能代表相应的总 体,同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值 的专业结 论。这要求有严密的实验设计和抽样设计,如样本是从同质总体中抽 取的一个随机样本,试验单位在干预前随机分组,有足够的样本量等。 2. 检验方法的选用及其适用条件,应根据分析目的、研究设计、资料类型、样 本量大小等选用适当的检验方法。 t 检验是以正态分布为基础的,资料的正态 性可用正态性检
42、验方法检验予以判断。若资料为非正态分布,可采用数据变换 的方法,尝试将资料变换成正态分布资料后进行分析。 3. 双侧检验与单侧检验的选择 需根据研究目的和专业知识予以选择。单侧检 验和双侧检验中的 t 值计算过程相同,只是 t 界值不同,对同一资料作单侧检 验更容易获得显著的结果。单双侧检验的选择,应在统计分析工作开始之前就 决定,若缺乏这方面的依据,一般应选用双侧检验。 4. 假设检验的结论不能绝对化 假设检验统计结论的正确性是以概率作保证的, 作统计结论时不能绝对化。在报告结论时,最好列出概率 P 的确切数值或给出 P 值的范围,如写成 0.02P0.05,同时应注明采用的是单侧检验还是双
43、侧检验, 以便读者与同类研究进行比较。当 P 接近临界值时,下结论应慎重。 5正确理解 P 值的统计意义 P 是指在无效假设 H0 的总体中进行随机抽样,所 观察到的等于或大于现有统计量值的概率。其推断的基础是小概率事件的原理, 即概率很小的事件在一次抽样研究中几乎是不可能发生的,如发生则拒绝 H0。 因此,只能说明统计学意义的“显著” 。 6假设检验和可信区间的关系 假设检验用以推断总体均数间是否相同,而可 信区间则用于估计总体均数所在的范围,两者既有联系又有区别。 T 检验属于均值分析,它是用来检验两类母体均值是否相等。均值分析是来考 察不同样本之间是否存在差异,而方差分析则是评估不同样本
44、之间的差异是否 由某个因素起主要作用。 t 检验:是假设检验的一种常用方法,当方差未知时,可以用来检验一个正态总体或两个正 态总体的均值检验假设问题,也可以用来检验成对数据的均值假设问题。具体内容可以参考 概率论与数理统计。可以用来判断两组数倨差异是否有显著 意义,也就是结果有没有统计学意义。 方差分析:它是处理实验研究资料时重要的分析方法 之一,代表数据是否具有统计意义, 一般一组数据代表某个条件或因素,方差分析可以判 断你选取的这个因素是否有意义,是不是影响因素 如果你做统计为了找到事物相关性,而方差结果显示 数据无统计学差异,很可能代表实验失败或设计有问 题 在 对均值进行假设检验时,一
45、般有两种参数检验方法,即 t 检验与方差分析。 t 检验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设计(给 出一组数据 和一个标准值的资料)的定量资料的均值检验场合;而方差分析用 在单因素 k 水平设计(k3)和多因素设计的定量资料的均值检验场合。应当 进一步说明的是, 方差分析有十几种,不同的方差分析取决于不同的设计类型。 很多人习惯于用 t 检验取代一切方差分析。 不能用 t 检验取代方差分析的情况 单因素 k(k3)水平设计时的情形。为了便于理解,举例说明。 实例研究单味中药对小鼠细胞免疫机能的影响,把 40 只小鼠随机均分为 4 组, 每组 10 只,雌雄各半,用药 15d
46、 后测定 E-玫瑰结成率(%),结果如下,试比 较各组总体均值之间的差别有无显著性意义? 对照组: 14 10 12 16 13 14 12 10 13 9 党参组: 21 24 18 17 22 19 18 23 20 18 黄芪组: 24 20 22 18 17 21 18 22 19 23 淫羊藿组: 35 27 23 29 31 40 35 30 28 36 处 理本例资料,通常人们错误的做法是,重复运用成组设计资料的 t 检验对 4 个组的均值进行 6 次两两比较;而正确的做法是,先进行单因素 4 水平设计资 料的方差分 析,若 4 个总体均值之间的差别有显著性意义,再用 q 检验等
47、方法 进行多个均值之间的两两比较。下面将从多个方面来说明上述两种分析方法之 间的差异(表 1)。 表 1 用 t 检验与方差分析处理实例资料的区别 比较的内容 资料的利用率 对原实验设计的影响 犯假阳性错误的概率结论的可 靠性 t 检验 低: 每次仅用两组 残:割裂了整体设计 大:1-(1-0.05)6 = 0.265 低:统计量的自由度小(=18) 方差分析加 q 检验 高:每次要用全部数据 全:与原实验设计相呼应 小: 0.05(假定 =0.05)高:统计量的自由度大(=36) 注:自由度大,所对应的统计量的可靠性就高,它相当于“权重”,也类似于 产生“代表”的基数,基数越大,所选出的“代
48、表”就越具有权威性。 多因素设计时的情形。为了便于理解,仍举例说明(表 2)。 表 2 注射氯化锂或烟碱后不同时间大鼠体温的下降值 使用氯化锂与否 使用烟碱与否 第二次注射后不同时间体温下降值(摄氏度) 0.7 1.5 3 5 - - 0.00.4 0.20.5 0.10.4 0.30.5 + - 0.70.5 0.10.5 0.10.6 0.20.5 - + 1.20.8 0.10.6 0.40.5 0.40.3 + + 1.70.6 0.70.6 0.30.6 0.10.5 显 然,表 2 中涉及到的 3 个实验因素(即”使用氯化锂与否”、“使用烟碱与否” 、“药物在体内作用时间”)。这些
49、因素之间一般都存在不同程度的交互作用, 应当 选用与设计类型(本例为具有一个重复测量的三因素设计)相对应的方差 分析方法。然而,对于处置复杂的实验设计问题,人们常犯的错误是在;其一, 将多因素各 水平的不同组合(本例中共有 16 种不同的组合,相当于 16 种不同 的实验条件)、简单地看作单因素的多个水平(即视为单因素 16 水平),混淆 了因素与水平之 间的区别,从而错误地确定了实验设计类型;其二,分析资料 时,常错误用单因素多水平设计或仍采用多次 t 检验进行两两比较。误用这两 种方法的后果是,不仅无 法分析因素之间的交互作用的大小,而且,由于所选 用的数学模型与设计不匹配,易得出错误的结论。 答:t 检验