1、 统 计 分 析(方差分析和回归分析)三、典型题解例 1:某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼 20 尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表.饲喂不同饲料的鱼的增重 (单位:10g)饲料 鱼的增重( xij) 合计 .ix平均 .ixA1 31.9 27.9 31.8 28.4 35.9 155.9 31.18A2 24.8 25.7 26.8 27.9 26.2 131.4 26.28A3 22.1 23.6 27.3 24.9 25.8 123.7 24.74A4 27.0 30.8 29.0 24.5 28.5 1
2、39.8 27.96合计 =550.8.x解:这是一个单因素等重复试验,因素数 ,重复数 .各项平方和及自由度计算4s05n如下: 220/5.8/()169.3CTns总平方和 2319785TijSxC6.57.168组间平方和 222220(314.7139.)3.9.0.AjxCn A组内平方和 167850ETAS总自由度 054fns处理间自由度 3A处理内自由度 196ETAff用 、 分别除以 和 便得到处理间均方 及处理内均方 .AS AMSES/4.27/38.0985164AAEEMSf因为 ;根据 , ,查表/38.09/.AF Af216Ef得 F F0.01(3,1
3、6) =5.29,,表明四种不同饲料对鱼的增重效果差异极显著,用不同的饲料饲喂,增重是不同的.例 2:抽测 5 个不同品种的若干头母猪的窝产仔数,结果见下表,试检验不同品种母猪平均窝产仔数的差异是否显著.五个不同品种母猪的窝产仔数品种号 观 察 值 xij (头/窝) xi. .ix1 8 13 12 9 9 51 10.22 7 8 10 9 7 41 8.23 13 14 10 11 12 60 124 13 9 8 8 10 48 9.65 12 11 15 14 13 65 13合计 T =265解:这是一个单因素试验,因素数 ,重复数 .现对此试验结果进行方差分析如5s05n下:计算
4、各项平方和与自由度 220/65/()809.CTsn222222.013413)809.948.1(5605).073.ijAjSxn68ETAS01524,154,240AETAfsnfsff列出方差分析表,进行 F 检验不同品种母猪的窝产仔数的方差分析表变异来源 平方和 自由度 均方 F 值品种间 73.20 4 18.30 5.83误差 62.80 20 3.14总变异 136.00 24根据 , 查临界 F 值得: F0.05(4,20) =2.87,F0.05(4,20) =4.43,因为14Af20EfF F0.01(4,20),表明品种间产仔数的差异达到 1%显著水平.例 3:
5、以 A、B、C、D 4 种药剂处理水稻种子,其中 A 为对照,每处理各得 4 个苗高观察值(cm),其结果如下表,试分解其自由度和平方和.水稻不同药剂处理的苗高(cm)药 剂 苗高观察值 总和 iT平均 iyA 18 21 20 13 72 18B 20 24 26 22 92 23C 10 15 17 14 56 14D 28 27 29 32 116 29T=336 21y解:计算各项平方和与自由度20Tns367542TijSyCC221836001()()kiiTnC27951/450或 A224()14)(111()knnkkEijiijiTASyyS6098进而可得均方:TM602
6、/54.3AS8E9/1.7总方差自由度 ,药剂间自由度 ,药剂内自由度Tf413Af1532Ef例 4:为研究雌激素对子宫发育的影响,现有 4 窝不同品系未成年的大白鼠,每窝 3 只,随机分别注射不同剂量的雌激素,然后在相同条件下试验,并称得它们的子宫重量,见下表,试作方差分析.各品系大白鼠不同剂量雌激素的子宫重量(g)雌激素注射剂量(mg/100g)( B)品系( A)B1(0.2) B2(0.4) B3(0.8)合计 xi. 平均 .ixA1 106 116 145 367 122.3A2 42 68 115 225 75.0A3 70 111 133 314 104.7A4 42 63
7、 87 192 64.0合计 x.j 260 358 480 1098平均 j. 65.0 89.5 120.0解:这是一个双因素单独观测值试验结果. A 因素(品系)有 4 个水平,即 =4;B 因素(雌激a素注射剂量)有 3 个水平,即 b=3,共有 b=34=12 个观测值.方差分析如下:a计算各项平方和与自由度22/1098/(43)1067.CTab22222222. 38)10467.3567.5.11(3149).0940.67.(580).0ijAjBjSxbSxCaA1651.4.30767543.4,13226eTABABeTBSfbfaf列出方差分析表,进行 F 检验方差
8、分析表变异来源 平方和 自由度 均方 F 值A 因素(品系) 6457.6667 3 2152.5556 23.77B 因素(剂量) 6074.0000 2 3037.0000 33.54误差 543.3333 6 90.5556总变异 13075.0000 11根据 , 查临界 F 值, F0.01(3,6)=9.78;根据 ,13Af2Ef12Bf查临界 F 值, F0.01(2,6)=10.92.26Ef因为 A 因素的 F 值 23.77 F0.01(3,6),差异极显著; B 因素的 F 值 33.54 F0.01(2,6),差异极显著.说明不同品系和不同雌激素剂量对大白鼠子宫的发育
9、均有极显著影响.例 7:在某个地区抽取了 9 家生产同类产品的企业,其月产量和单位产品成本的资料如表8-1,建立月产量 x 和单位产品成本 y 之间的直线方程.并估计当月产量 x=10(千件)时,单位产品成本的数值.企业编号 1 2 3 4 5 6 7 8 9月产量(千件) (x) 4.1 6.3 5.4 7.6 3.2 8.5 9.7 6.8 2.1单位产本(元) (y) 80 72 71 58 86 50 42 63 91解:将表中有关数据代入公式,得: 22 293.57613 .4()0.nxyb, ,5.97x68.1y8.().906.8abx所以回归方程为: 04当 (千件) ,
10、 (元).10x106.8.4208yx例 8:为研究某一化学反应过程中,温度 对产品得率 的影响,测得数据如下:()C(%)Y温度 ()xC100 110 120 130 140 150 160 170 180 190得率 %Y45 51 54 61 66 70 74 78 85 89(1) 求变量 关于 的线性回归方程.x(2) 的无偏估计.2(3) 检验回归方程的回归效果是否显著(取 ).05解: (1) ,经计算得10n01 1011022145, 673, 85, 47, 570i ii i ixyxyxy 2401057673985xyS故得,0.483xySb16731450.8
11、32.7950a于是得到回归直线方程 2.9.yx或写成 67.3048(15)(2)由以上计算计算结果得 22211()6739.1nnyiiSy又已知 , ,故3985xy0.43b27.230.98yxSbn(3)待检验假设 ,0: Hb1: 0由(1)和(2)知 .查表得20.483, 50, 9xbS.52.()(8)360tnt假设 的拒绝域为0: H|2.306|xtSb现在0.483| 54.9t故拒绝 ,认为回归效果是显著的.0: Hb例 9:某商品的需求量(单位:件) 与价格 (单位:元)的统计资料如下所示yxy543 580 618 695 724 812 887 991
12、 1186 1904x45 51 54 61 66 70 74 78 85 89求需求函数的回归方程.解:画散点图,根据散点图选择曲线类型 来描绘需求量 与价格 的关系byaxyx经变换,得 lnlnabx利用最小二乘法的 和 的估计值, 9.1206.6902所以 , .485aeb故需求回归方程为: ,0.6921.yx将 与 的值加以对比如下:yy543 580 618 695 724 812 887 991 1186 1904536 583 614 682 742 771 917 1050 1198 1886可见 与 数据相近,效果较好.y四、练习题1.把下面的方差分析表填写完整,方差
13、来源 平方和 自由度 修正(方差)组间 131.37 (1) (3)组内 (2) 15 (4)总和 332.48 19 临界值参考答案:(1)4(2)201.11(3)32.84(4)13.412.一批由相同材料织成的布料,使用染整工艺 , , ,分别处理后进行强度试验,1B23实测数据(单位: )为:2/kgm工艺 :0.94 0.86 0.90 1.26 1.041B工艺 :1.28 1.72 1.60 1.602工艺 :1.02 0.86 1.00 1.22 1.33 1.103试分析不同染整工艺下布料强度的差异显著性?( )0.1参考答案: ,不显著.0.1.765(2,)86F=4.
14、设四名工人操作机器 各一天, 其日产量如表 8.7 所示, 问不同机器或不同工人3,A对日产量是否有显著影响( )?.1B234B1A50 47 47 53253 54 57 58工人日产量机 器1B234B3A52 42 41 48参考答案: ,显著;0.19.8(,6).29AF=,不显著.24B8某地高校教育经费(x)与高校学生人数(y)连续 6 年的统计资料如下:教育经费(万元) ( )X316 343 373 393 418 455在校学生数(万人) ( )Y11 16 18 20 22 25要求:(1)建立议程回归直线方程,估计教育经费为 500 万元的在校学生数;(2)计算估计标
15、准误差.参考答案:(1) , 29.84338(2)=-17.92+0620.86499. 以下是子代和父代受教育年限的抽样调查 父代( )X2 4 6 8 10子代( )Y4 5 8 7 9求:(1)子代受教育年限( )关于父代受教育年限( )的回归直线.X(2) 的无偏估计.(3)判断该结论是否具有推论意义( ).05参考答案:(1) , (2) (3) ,显著.Y=3+0.6X9025|.98(3)184tt10. 设对某产品的价格 P 与供给量 S 的一组观察数据如下表:价格 P(百元) 2 3 4 5 6 8 10 12供给量 S(吨) 15 20 25 30 35 45 60 80据此求:(1)该产品的价格 P 关于供给量 S 的回归直线.(2) 的无偏估计.(3)是否具有推论意义?( ).05参考答案:(1) , (2) (3)Y=-0.1754+6.8X1.84,不显著.25|0.7()9tt11.以下是生活期望值与个人成就的抽样调查生活期望值 10 8 7 6 4 3 2 1个人成就 7 9 10 4 2 1 3 2求:(1)回归直线(2) 的无偏估计.(3)是否具有推论意义( ).05参考答案:(1) , (2) (3)Y=.268+.74X5.089,不显著.05|.27()9tt