1、 第 5 章 方差分析方差分析是统计学的一个重要范畴,是对观察结果的数据作分析的一种常用的统计方法,目的是检验两个或多个样本均数间差异的显著性意义。这种命名是因为在检验均数间差异是否具有统计学意义的过程中,我们实际上是通过比较方差而得到结果的。方差分析主要用于均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用和方差齐性检验。方差分析具有广泛的用途,例如医学界研究几种药物对某种疾病的疗效可以用方差分析方法去解决。方差分析的概念在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间差异。方差分析是检验两个或多个样本均数间差异是
2、否具有统计意义的一种方法。1方差分析原理方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:(l)随机误差,例如测量误差造成的差异,称为组内差异。用变量在各组的均值与该组内变量值之偏(离均)差平方和的总和表示。记作 SS 组内 。(2)实验条件, 即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏(离均)差平方和的总和表示。记作 SS 组间 。SS 组间 、SS 组内 除以各自的自由度得到其均方值即组间均方和组内均方。一种情况是处理没有作用,即各样本均来自同一总体。 MS 组间 /MS 组内 l。考虑抽样误差的存在,则有 MS 组间 /MS 组内 l。另一种情况是
3、处理因素确实有作用。组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,组间均方会远远大于组内均方。MS 组间 MS 组内 。MS 组间 /MS 组内 比值构成 F 分布。用 F 值与其临界值比较,推断各样本是否来自相同的总体。2方差分析的假设检验假设有 m 个样本,如果原假设 H0:样本均数都相同 1= 2= 3= = m=,m 个样本有共同的方差 2。则 m 个样本来自具有共同的方差 2和相同的均数 的总体。如果经过计算结果组间均方远远大于组内均方的 FF 0.05(f 组间,f 组内) , (括号中的两个 f是自由度)则 p005,推翻原假设,说明样本来自不同的正态总
4、体,说明处理造成均值的差异,有统计意义。否则,FF 0.05(f 组间,f 组内) ,P005 承认原假设,样本来自相同总体,处理无作用。方差分析中的术语方差分析中常用的术语有以下几个:1因素与处理因素是影响因变量变化的客观条件;处理是影响因变量变化的人为条件。也可以通称为因素。例如影响农作物产量的因素有气温、降雨量、日照时间等;研究不同肥料对不同种系农作物产量的影响时农作物的不同种系可称为因素,所施肥料可视为不同的处理。一般情况下 Factors 与 Treatments 在方差分析中可作相同理解。在要求进行方差分析的数据文件中均作为分类变量出现。即它们的值只有有限个取值。即使是气温、降雨量
5、等平常看作是连续变量的,在方差分析中如果作为影响产量的因素进行研究,就应该将其数值用分组定义水平的方法事先变为具有有限个取值的离散变量。2水平因素的不同等级称作水平。例如,性别因素在一般情况下只研究两个水平:男、女。化学实验或生物实验中的“剂量”必须离散化为几个有限的水平数。如:lml、2ml、4ml 三个水平。应该特别注意的是在 SPSS 数据文件中,作为因素出现的变量不能是字符型变量,必须是数值型变量。例如性别变量 SEX,定义为数值型,取值为 0、l。换句话说,因素变量的值实际上是该变量实际值的代码,代码必须是数值型的。可以定义值标签 F、M(或Female、male)来表明 0、l 两
6、个值的实际含义,以便在打印方差分析结果时使用。使结果更加具有可读性。3 单元(Cell)在方差分析中 Ce11 指各因素的水平之间的每个组合。例如研究问题中的因素有性别Sex,取值为 1、2;有年龄,分三个水平 1(10 岁) 、2(11 岁) 、3( 12 岁) 。两个变量的组合共可形成六个单元:1,l 、 l,2 、 1,3 、 2,l 、 2,2 、 2,3 ,代表两种性别与三种年龄的六种组合。4因素的主效应和因素间的交互效应这是在科学实验中常常遇到的问题。举例说明之:有 A、B 两种药物治疗缺铁性贫血,患者 12 例,分为 4 组。实验方案是:第一组用一般疗法;第二组在一般疗法基础上加
7、用 A药;第三组在一般疗法基础上加用 B 药,第四组在一般疗法基础上 A、B 两药同时使用。一个月后观察红细胞增加数。要求分析两种药物的疗效(数据见表 12l) 。数据来源于医用统计方法 (金丕焕,人民卫生出版社) 。表 121 实验数据(红细胞增加数百万/m 3)第一组 第二组 第三组 第四组0.8 1.3 0.9 2.10.9 1.2 1.1 2.20.7 1.1 1.0 2.0各组平均值 0.8 1.2 1.0 2.1这是个双因素方差分析的问题,因素 A 与因素 B。每个因素均有用该药与不用该药两个水平,研究药物 A 和 B 是否对红细胞的增加有显著影响是对红细胞增加数的均值作以下比较:
8、(l)比较第二组的均值与第一组的均值是否有显著性差异。(2)比较第三组的均值与第一组的均值是否有显著性差异。前两项研究的是 A、B 两因素的主效应。(3)除了比较第四组的均值与第一组的均值是否有显著性差异外还要研究 A 药对 B 药的疗效是否有影响。若 A 药对 B 药疗效无影响,那么除抽样误差外,第四组与第二组均值之差应该等于第三组均值减去第一组均值。但是实际上(2.11.2)=0.9;(1.00.8)=0.2。竞相差 0.7,该差值几乎与第一组均值相同。0.7 的差值包括抽样误差和 A、B 药的相互作用。这种因素之间的相互作用在统计学上称之为交互效应。如果交互效应存在,说明两个因素不是相互
9、独立的。5均值比较均值的相对比较是比较各因素对因变量的效应的大小的相对比较。例如研究 A、B 效应之和是否等于它们的交互效应。或者研究 A、B 对红细胞增加数的效应是否相等,等。均值的多重比较是研究因素单元对因变量的影响之间是否存在显著性差异,例如例题中研究 A、B 药物对红细胞增加数的疗效是否存在显著性差异。6协方差分析在一般进行方差分析时,要求除研究的因素外应该保证其他条件的一致。作动物实验往往采用同一胎动物分组给予不同的处理,研究各种处理对研究对象的影响就是这个道理。例如研究身高与体重的关系时要求按性别分别进行分析。这样消除性别因素的影响。不同年龄的身高对体重的关系也是有区别的,被测对象
10、往往是不同年龄的。要消除年龄的影响,应该采用协方差分析。7重复测量(略)在社会学研究中常常遇到的问题是,研究社会某些条件对人类特定方面的特性的影响,社会调查、数据采集量相当大。往往是在某一个地区采样 100,另一个地区采样 100。两个地区的社会条件对研究对象来说可能是独立的,但同一地区的 100 个个体同处于相同社会条件下,彼此并不独立。进行方差分析时修正条件不独立造成的误差,或者比较组间因素与组内因素的效应,以便得出正确的分析结论,使用重复测量的方差分析。方差分析过程SPSS 提供的方差分析过程有:1Oneway 过程Onewny 过程就是单因素简单方差分析过程,它在 Analyze 菜单
11、中的 Compare Means 过程组中,用 OneWay ANOVA 菜单项调用,可以进行单因素方差分析、均值多重比较和相对比较。单因素方差分析单因素方差分析也称作一维(元)方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析即进行均值的多重比较。oneWay ANOVA 过程要求因变量属于正态分布总体、如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure 命令调用 G
12、LM 过程。举例一(data12-01)用四种饲料喂猪,共 19 头猪分为四组,每组用一种饲料。一段时间后称重。猪体重增加数据如下:饲料比较数据资料饲料A B C D133.8 151.2 193.4 225.8125.3 149.0 185.3 224.6143.1 162.7 182.8 220.4128.9 143.8 188.5 212.3135.7 153.5 198.6Fodder 变量:数值型,取值 1、2、3、4 分别代表 A、B、C、D 四种饲料。Weight 变量:数值型,其值为猪体重的增加数。应该特别注意,不能把 A、B、C、D 定义为四个变量。操作步骤:(1)读取数据
13、data1201。(2)按 AnalysisCompare MeansOneWay ANOVA 顺序,展开 OneWay ANOVA 主对话框。(3)指定因变量: Weight;因素变量: fodder;表 1 即为单因素变量饲料 fodder 对猪体重 weight 的影响分析结果。表的左上方是因变量 weight 。(1)输出结果说明第一栏:方差来源,包括组间变差 Between Groups;组内变差: Within Groups 和总变差 Total。第二栏:离差平方和,组间离差平方和为 20538.698,组内离差平方和为 652.159 总离差平方和为 21190.258,是组间离
14、差平方和与组内离差平方和相加之和。第三栏:自由度,组间自由度为 3;组内自由度为 15;总自由度为 18。第四栏:均方差,是第二栏与第三栏之比。组间均方差为 6846.233。组内均方差为43.4770 第五栏:F 值,是组间均方与组内均方之比。第六栏:F 值对应的概率值。针对假设 H0:组间均值无显著性差异,即四种饲料对猪体重的增加的平均值无显著性差异) 。计算的 F 值 157.4668,对应的概率值为 O.000。(2)结果分析根据输出的 p 值为 O.000 可以看出,无论临界值取 0.05,还是取 O.01,p 值均小于临界值。因此否定 H0假设,四种饲料对猪体重均数有显著性意义,结
15、论是四种饲料对猪体重的增加明显作用不同。根据该结论选择饲料,犯错误的概率几乎为 O。(3)存在问题与解决方法本例只考虑了猪体重的增加量,对其均值进行了比较但实际工作中的问题往往不是这样简单,例如是否应该考虑每头猪的进食量对体重增加的影响,去除这个影响比较猪体重的增加会对饲料比较得出更切合生产实际的结论。这个问题应该使用 ANOVA 过程的协方差分析功能去解决。使用系统默认值进行单因素方差分析只能得出是否有显著性差异的结论,本例数据量少,哪两组之间差别最大,哪种饲料使猪体重增加更快,几乎是可以看出来的。实际工作中往往需要两两的组间均值比较。这就需要使用 oneWny ANOVA 进行单因素方差分
16、析时使用选择项从而获得更丰富的信息,使分析更深入。单因素方差分析的选择项单因素方差分析的选择项分为三类:Contrasts 功能按钮,可以指定一种要用 t 检验来检验的 Priori 对比;Post Hoc 功能按钮,可以指定一种多重比较检验;option 功能按钮,可以指定要输出的统计量,指定处理缺失值的方法。分别使用主对话框中的三个按钮打开相应的对话框,然后进行选择。1进行均值的多项式比较的选择项在主对话框中,鼠标单击 Contrasts 按钮,打开 Contrasts 对话框。均值的多项式比较是包括两个或更多个均值的比较。单因素方差分析的 one way ANOV过程允许进行高达 5 次
17、的均值多项式比较。多项式的系数需要由读者自己根据研究的需要输入。具体的操作步骤如下:(1)选中 polynomial 复选项,该操作激活其右面的 Degree 参数框。(2)单击 Degree 参数框右面的向下箭头展开阶次菜单,可以选择 Linear 线性、Quadratic二次、 Cubic 三次、 4th 四次、 5th 五次多项式。(3)为多项式指定各组均值的系数。方法是在 Coefficients 框中输入一个系数,单击 Add按钮,Coefficients 框中的系数进入下面的方框中。依次输入各组均值的系数,在方形显示框中形成一列数值。因素变量分为几组,输入几个系数,多出的无意义。如
18、果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为 O 值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。可以同时建立多个多项式。一个多项式的一级系数输入结束,激活 Next 按钮,单击该按钮后 Coefficients 框中清空,准备接受下一组系数数据。如果认为输入的几组系数中有错误,可以分别单击 Previous 或 Next 按钮前后翻找出错误的一组数据。单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后年击Change 按钮,在系数显示框中出现正确的系数值。当在系数显示框中选中一个系数时,同时激活 Remove 按
19、钮;单击该按钮将选中的系数清除。(4)单击 previous 或 Next 按钮显示输入的各组系数检查无误后,按 Continue 按钮确认输入的系数并返回到主对话框。要取消刚刚的输入,单击 Cancel 按钮:需要查看系统的帮助,单击 Help 按钮。2.各组均数的多重比较选择项在主对话框中,单击 Post Hoc 按钮,展开 Post Hoc Multiple Comparisons 对话框,在这对话框中选择进行均值多重比较的方法。多重比较有如下选择项:(l)方差具有齐次性时(equal variance assumed) ,该矩形框中有如下选择方法:Least-significant d
20、ifference(LSD)复选项,用 t 检验完成各组均值间的配对比较。对多重比较误差率不进行调整。TUKEY(Tukeys honestly significant difference)复选项,用 Student-Range 统计量进行所有组间均值的配对比较,用所有配对比较误差率作为实验误差率。Duncan(Duncans multiple range test)复选项,指定一系列的 Range 值,逐步进行计算比较得出结论。(2)方差不具有齐次性时(Equal variance not assumed)检验各均数间是否有差异的方法有四种可供选择:Tamhanes T2 复选项,t 检验
21、进行配对比较。Dunnentts T3 复选项,正态分布下的配对比较。3输出统计量的选择在主对话框中,单击 option 按钮,展开 option 对话框。各组选择项的含义如下:(l)statistice 栏中,输出统计量的选择项。Descriptive 复选项,要求输出描述统计量。选择此项,会计算并输出:观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量的 95置信区间。Homogeneityof variance 复选项,要求进行方差齐次性检验,并输出检验结果。用 Levene test 检验,即计算每个观测量与其组均值之差,然后对这些差值进行一维方差分析。(2)Mean
22、plot 复选项,即均数分布图,根据各组均数描绘出因变量的分布情况。(3) Missing Values 栏中,选择缺失值处理方法。Exclude cases analysis by analysis 选项,对含有缺夫值的观测量根据缺失值是因变量还是自变量从有关的分析中剔除。 Exclude cases instwise 选项对含有缺失值的观测量从所有分析中剔除。以上三组选择项选择完成后,按 Continue 按钮,确认选择并返回主对话框。单击Cancel 按钮作废本次选择:单击 Help 按钮,显示有关的帮助信息。使用选择项的单因素方差分析实例(1)读取数据 data1201。(2)按 An
23、alysisCompare MeansOneWay ANOVA 顺序,展开 OneWay ANOVA 主对话框。(3)指定因变量: Weight;因素变量: fodder;指定选择项 打开 Contrasts 对话框,选择多项式比较选择一次多项比较各组均值,共指定了 2 组多项式系数:1.0*meanl1.0*mean2 1.0*mean3 十 1.0*mean4 检验饲料对使猪体重增加的效应,A、D饲料效应和与 B、C 饲料效应和之间是否有显著性差异。1.0*meanl1.0*mean2 十 1.0*mean31.0*mean4 检验 A、C 饲料效应和与 B、D 效应和之间是否有显著性差异
24、。 单击 Post Hoc 按钮,展开 Post Hoc Multiple Comparisons 对话框,选择多重比较:在 Equal Variance Assumed 栏中,选择 LSD、 Duncan 两种方法。在 Equal Variance Not Assumed 栏中,选择 TamhanesT2 方法单击 options 按钮,展开 Options 对话框,输出统计量选择项:结果说明表 1 为描述统计量结果表。给出了四种饲料分组的样本含量 N、平均数 Mean、标准差 Std Deviation、标准误 Std Error、95的置信区间、最小值和最大值。表 2 为方差齐次性检验结
25、果。从显著性概率看, p0.05,说明各组的方差在=0.05水平上没有显著性差异,即方差具有齐次性。这个结论在选择多重比较方法时作为一个条件。表 3 是使用选择项的方差分析结果。与未使用选择项的输出结果一样给出了组间、组内的偏差平方和、均方、 F 值和概率 p 值。 P0.05;Contrast2,p0.05;说明各组方差具有齐次性。图 8 是以因素变量 fodder 为横轴,以独立变量 Weight 为纵轴而绘制的均数散点图。可看出各组均数的水平分布。应该特别说明的是,选取哪些选择项是根据研究需要进行的。本例中希望比较各种饲料对猪体重增加的效应,因此选择多重比较的选择项。相对比较在此例中无实
26、际意义,只是为了说明选择项的使用方法才选择了 Contrast 选择项。举例二(data12-02)下面的数据是 ERDMAN(1946)的一个实验。同种三叶草被接种上不同的菌种测量三叶草植物中含氮量。每组数据中前面一个是菌种代码,变量名是 strain,SPSS 分析过程要求因素变量必须为数值型变量。后面一个是含氮量,变量名是 nitrogen。(1)读取数据 data1202。(2)按 AnalysisCompare MeansOneWay ANOVA 顺序,展开 OneWay ANOVA 主对话框。(3)指定因变量: nitrogen;因素变量: strain;(4) 单击 Post H
27、oc 按钮,展开 Post Hoc Multiple Comparisons 对话框,选择多重比较:在 Equal Variance Assumed 栏中,选择 LSD、TUKEY 两种方法。在 Equal Variance Not Assumed 栏中,选择 TamhanesT2 方法(5)单击 options 按钮,展开 Options 对话框,输出统计量和方差齐性检验选择项:2General Linear Model(简称 GLM)过程GLM 过程由 Analyze 菜单直接调用,该过程可以完成简单的多因素方差分析和协方差分析,并且不但可以分析各因素的主效应,还可以分析各因素间的交互效应
28、。GLM 过程属于专业统计和高级统计分析过程,在 Analyze 菜单中直接调用 General Linear Model 过程,该过程有四项命令,分别完成不同任务。这四项的主要功能分别是:(l)Univariate 命令Univariate 命令调用 GLM 过程完成一般的单因变量、多因素方差分析。如果指定了协变量,则可进行协方差分析。Univariate 过程在指定模型方面有较大的灵活性,并可以提供大量的统计输出。(单因变量)多因素方差分析过程单因变量多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的回归分析和方差分析。利用该方差分析过程,可以检验不同组之间均数由于受不同
29、因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差和协方差交互作用。单因变量多因素方差分析的菜单和选择项单变量多因素方差分析的步骤:AnalysisGeneral Linar ModelsGLMUnivariate顺序逐一单击鼠标键,最后展开 GLMUnivariate 主对话框。用与前 2 节中叙述的相同方法确定因变量,因变量移到 Dependent Variable 框中定义;固定变量移到 Fixed Facter 框中,随机变量移到 Random Facter 中。应该特别注意由于内存容量的限制选择的因素水平组合数单元数)应该尽量
30、少。因素数量和对选定因素定义的取值范围决定了组合数。如果需要去除协变量的影响,将协变量移到 Covariates 框中。如果需要分析权重变量的影响,将权重变量移到 WLS Weight 框中。完成以上工作即可通过功能按钮展开相应对话框选择模型、对比、输出统计量。l 选择分析模型在主对话框中,单击 Model 按钮,展开 Univariate :Model 对话框。(l)在 Specify Model 栏中指定模型类型。 Full Factorial 选项,此项为系统默认的模型类型。该项选择建立全模型。全模型包括所有因素变量的主效应和所有的交互效应。例如有三个因素变量,全模型包括三个同素变量的主
31、效应、两两的交互效应和三个因素的交互效应。Custom 选项,建立自定义的模型。此项的选择激活下面各操作框。(2)建立自定义模型选择了 Custom 后,在 FactorsCovariates 框中自动列出可以作为因素变量的变量名,其变量名后面的括号中标有字母“F” ;和可以作为协变量的变量名,其变量名后面的括号中标有字每“C” 。选择模型中的主效应鼠标键单击某一个单个的因素变量名该变量名背景将改变颜色(一般变为蓝色) ,单击Build Term(s)栏中下面的箭头,该变量出现在 Mode1 中。一个变量名占一行称为主效应项。欲在模型中包括几个主效应项,就进行几次如上的操作。注意,选择主效应必
32、须选择一个,用箭头按钮送入模型一个。也可以同时送两个或多个到 Model 框中。选择交互效应类型在 Build Term(s)栏中有一个可下拉的小菜单:Main effects 选项,选中此项可以指定主效应。指定上效应也可以使用所叙述的方法。Interactin 选项,选中此项可以指定任意的交互效应。All2way 选项,指定所有 2 维交互效应。All3way 选项, 指定所有 3 维交互效应。All4Way 选项,指定所有 4 维交互效应。All4Way 选项,指定所有有 5 维交互效应。在下拉菜单中用鼠标单击某一项,该项背景改变颜色后下拉菜单收回选中的交互类型菜单项占据矩形框。建立模型中
33、的交互项利用选中的交互效应类型可以建立模型中的交互项了。例如,因素变量有 Light(F)、Device(F) 、 Target(F) 。要求模型中包括变量 Light 与 Device 交互效应,相应的操作是在FactorsCovariates 框内的变量表中,用鼠标单击 device 变量使其背景改变颜色,此为选择了交互项之一,再用鼠标单击变量 light 变量使其背景改变颜色;此为选择了交互项之二。单击 Build Term(s)栏内参数框的箭头按钮,一个交互效应出现在 Model 框中。模型增加了一个交互效应项:device*light。要求模型中包括三个变量的所有 2 维交互效应项时
34、应该分别用鼠标单击light、Device、Target 三个变量名。在 Build Term(s)栏内参数框中选择 All2way 项,单击箭头按钮。在 Model 中出现三个 2 维交互效应项: light*device、 light*target、device*target。若要求模型中包括所有 3 维效应,由于可以作为因素变量的只有三个变量,因此可以有两种操作方法。鼠标分三次单击变量 light、 device、 target。选择 Build Term(s)栏内参数框中的 Interaction 或 All3way 项,再申击箭头按钮,均可以在 Model 框中出现3 维交互效应项:
35、ligh*device*target。(3)选择分解平方和的方法在对话框的下部有 Sum of 后跟一个矩形框,可以进行四项选择来确定平方和的分解方法,包括 TYPEI、 TYPE、 TYP 和 TYPEIV 四种。其中 TYPE是系统默认的,也是常用的一种。2 选择对照方法在主对话框中,单击 Contrast。按钮,展开 Contrasts 对话框。(1)在 Factors 框中显示出所有在主对话框中选中的因素变量。因素变量名后的括号中是当前的对比方法。(2) Change Contrast 栏中改变对照方法。None 选项,不进行均数比较。Deviation 选项,比较预测变量或因素的每个
36、水平的效应。选择 Last 或 First 作为忽略的水平。Simple 选项,除了作为参考的水平外对预测变量或因素变量的每一水平都与参考水平进行比较。选择 Last 或 Firt 作为参考水平。Difference 选项,对预测变量或因素每一水平的效应,除第一水平以外,都与其前面各水平的平均效应进行比较。与 Helmert 对照方法相反。对照的参考水平有两个,只有选择了 Deviation 或 Simple 方法时需要选择参考水平。共有两种可能的选择,最后一个水平 Last 选项和第一水平 Fist 选项。系统默认的参考水平是 Last。3 选择分布图形在主对话框中,单击 Plots 选项,
37、展开 Univariate : Profile Plots 对话框。对话框是为描绘因变量的均数分布而设置的,它可以一个或多个因素变量为参考做因变量的均数分布图。横坐标框,纵坐标框,散点框。例如要以 targat 变量为横轴,以 Score 均数为纵轴。做 score 变量均数的分布图,则在Factors 中选中 targat 变量将其移入 Honrizontal Axis 框中,再单击 Add 钮,将其送入下面的 Plot 框中即可。精,再重新输入正确内容。在检查无误后担 Continue 按钮确认,返回到主均话框。如果取消做图单击 Cancel 钮。需要查看系统的帮助信息,单击 Help。4
38、 多重比较分析在主对话框中,单击 Post Hoc5 选择保存运算值在主对话框中,单击 Save 按钮。通过在对话框中的选择,可以将所计算的预测值、殊差和检测值作为新的变量保存在编辑数据文件中。以便在其他统计分析中使用这些值。举例一(data12-03)随机区组设计资料的方差分析使用系统默认值进行随机区组设计资料的方差分析四个种系未成年雌性大白鼠各三只,每只按一种剂量注射雌激素,一段时间后,解剖称子宫重量。 操作方法与步骤定义三个变量:两个分类变量,一个连续变量。大白鼠种系变量mouse,取值 14,是种系 AD 种系的代码。雌激素剂量变量:etrogen,取值 l3,是剂量 0.2、0.4、
39、0.8 三种剂量的代码。子宫重量变量: wuteri,连续变量。是本课题的研究对象。不同种系、剂量的子宫重量剂量种系 0.2(1) 0.4(2) 0.8(3)A(1) 106 116 145B(2) 42 68 115C(3) 70 111 133D(4) 42 63 87输出结果表 1 为变量信息,大白鼠子宫重量按大白鼠种系和雌激素剂量分组。表 2 是方差分析表,在表的左上方标明研究的对象是 wuteri 。Sours 列:偏差的来源。这一列表明此列不面将按以下各项列出各统计量:Corrected Model 校正模型 Mouse、Etrogen。 Intercept 截距。在分析中没有实际
40、意义。Error 误差。Total 是偏差平方和在数值上等于截距、主效应、误差之和。Corrected Total 校正总和。偏差平方和在数值上等于校正模型与误差之和。TYP sum of squares 偏差平方和。df 自由度。 Mean Square 均方。数值上等于偏差平方和除以相应的自由度。F 值,是两个均方差之比。Sig,进行 F 检验的 p 值。从 p 值看,此得出种系和剂量对因变量在.=0.05 水平上是有显著性差异的。举例二(data12-04)2*2 析因实验方差分析实例有 A、B 两种药物治疗缺铁性贫血,患者 12 例,分为 4 组。实验方案是:第一组用一般疗法;第二组在
41、一般疗法基础上加用 A 药;第三组在一般疗法基础上加用 B 药,第四组在一般疗法基础上 A、B 两药同时使用。一个月后观察红细胞增加数。要求分析两种药物的疗效(数据见表 12l) 。数据来源于医用统计方法 (金丕焕,人民卫生出版社) 。表 121 实验数据(红细胞增加数百万/m 3)第一组 第二组 第三组 第四组0.8 1.3 0.9 2.10.9 1.2 1.1 2.20.7 1.1 1.0 2.0各组平均值 0.8 1.2 1.0 2.1数据说明:因素变量两个:drugA 和 drugB,两个变量均有两水平,0 表示不用此药,1 表示使用此药。因变量:redcell(红细胞增加数百万/m 3) 。结果说明与分析表 1 是“两种药物对红细胞增加数作用的研究”课题中的变量信息。表中列出 drugA 和drugB 两个因素变量和分类水平,以及每水平的样本含量。表 2 为方差分析结果。可以看出 drugA、 drugB 均对红细胞的增加有显著疗效。并且交互效应也很显著。