1、1暨南大学硕士研究生医学统计学SPSS 统计软件上机练习题1. 10 名 15 岁中学生身高体重数据如下:表 1 10 名 15 岁中学生身高体重数据编号 1 2 3 4 5 6 7 8 9 10性别 男 男 男 男 男 女 女 女 女 女身高(cm) 166.0 169.0 170.0 165.1 172.0 159.4 161.3 158.0 158.6 169.0体重(kg) 57.0 58.5 51.0 58.0 55.0 44.7 45.4 44.3 42.8 51.5SPSS 数据工作表sex height weigh1 166.0 57.01 169.0 58.5 2 158.6
2、 42.82 169.0 51.5体重指数(BMI)体重(kg) / 身高(m) 2,即体重(kg)除以身高(m)的平方。回答下列问题:(1)男生体重指数的均数为 19.74 (kg/m 2) ;标准差为: 1.54 (kg/m 2)(2)女生体重指数的均数为 17.57 (kg/m 2) ;标准差为: 0.38 (kg/m 2)参考:用 Compute 过程 bmi = kg /(cm / 100) * 2 ; Mean,性别为分组变量列联分析:2. 将 126 例十二指肠球部溃疡病人随机分为两组。甲药组治疗 62 人,54 人有效;乙药组治疗 64 人,44 人有效。问两种药物的治疗效果有
3、无差别?(1)SPSS 数据工作表group effect fre1 1 541 2 82 1 442 2 20(2)选用 SPSS 过程:Weight cases ;Analyze Descriptive StatisticsCrosstabs 。(3)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断):经 2 检验, 2=6.13,P = 0.013。 可认为两种药物的治疗效果有差别,2即甲药有效率(87.1%)高于乙药( 68.8%) 。 3. 某医师研究物理疗法、药物疗法和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表 3。问三种疗法的有效率有无差别?表 3 三种疗
4、法治疗周围性面神经麻痹的疗效分组 治疗例数 有效例数 有效率()物理疗法 206 199 96.6药物疗法 182 164 90.1外用膏药 144 118 81.9(1)SPSS 数据工作表group effect fre1 1 1991 2 72 1 1642 2 183 1 1183 2 26(2)选用 SPSS 过程:Weight cases ; AnalyzeDescriptive StatisticsCrosstabs 。(3)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断):经 2 检验, 2=21.04,P = 0.000。可以认为三种疗法治疗周围性面神经麻痹的
5、有效率有差别。4. 某医师在研究血管紧张素 I 转化酶(ACE)基因 I/D 多态与型糖尿病肾病(DN)的关系时,将 249 例型糖尿病患者按有无糖尿病肾病分为两组,资料见表 7-9。问两组型糖尿病患者的 ACE 基因型分布有无差别?表 4 DN 组与无 DN 组 2 型糖尿病患者 ACE 基因型分布的比较组别 DD ID II 合计DN 组 42( 37.8) 48(43.3) 21( 18.9) 111无 DN 组 30( 21.7) 72(52.2) 36( 26.1) 138合计 72( 28.9) 120(48.2) 57( 22.9) 249(1)选用 SPSS 过程:Weight
6、 cases ; AnalyzeDescriptive StatisticsCrosstabs 。(2)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断):经 2 检验, 2=7.91,P = 0.019。可认为 DN 组与无 DN 组的 2 型糖尿病患者的 ACE 基因型分布不同。5. 测得某地 5801 人的 ABO 血型和 MN 血型结果如表 7-10,问两种血型系统之间是3否有关联?表 5 测得某地 5801 人的血型结果MN 血型ABO 血型M N MN 合计O 431 490 902 1823A 388 410 800 1598B 495 587 950 2032AB
7、 137 179 32 348合计 1451 1666 2684 5801(1)选用 SPSS 过程:Weight cases ; AnalyzeDescriptive StatisticsCrosstabs 。(2)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断):经 2 检验, 2=213.16,P = 0.000。可认为两种血型系统间有关联。列联系数为0.1883(P0.000 ) ,虽然有统计学意义,但数值较小,可认为两种血型系统间的关联不太密切。等级相关:6. 某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将 278 例尸解资料整理成表 7-13,问年龄与冠状动
8、脉粥样硬化等级之间是否存在线性变化趋势?表 6 年龄与冠状动脉硬化的关系冠状动脉硬化等级(y)年龄(岁)(X) + + + 合计20 70 22 4 2 9830 27 24 9 3 6340 16 23 13 7 5950 9 20 15 14 58合计 122 89 41 26 278(1)选用 SPSS 过程:Weight cases ;Analyze Descriptive StatisticsCrosstabs 。(2)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断):经 2 检验,线性回归分量有统计学意义( 2=63.39,P = 0.000) 。等级相关系数为An
9、alyze correlate bivariate 0.488(P = 0.000) 。该资料说明冠状动脉硬化程度的等级随着年龄的增加而增高。7. 某试验室分别用乳胶凝集法和免疫荧光法对 58 名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表。问两种方法的检测结果有无差别?表 7 两种方法的检测结果乳胶凝集法免疫荧光法 + 合计+ 11 12 234 2 33 35合计 13 45 58(1)选用 SPSS 过程:Weight cases; AnalyzeDescriptive StatisticsCrosstabs ;在 Statistics 对话框,选择 McNemar。(2)SPS
10、S 的结果与解释(包括检验方法、统计量、P 值和统计推断):经配对四格表资料的 2 检验(McNemar) ,P = 0.013。按=0.05 水准,认为两种方法的检测结果不同,免疫荧光法的阳性检测率(23/58 )高于乳胶凝集法(13/58 ) 。两个独立样本 t-test8. 例 4.4 将 14 只大白鼠随机分为两组,一组做成白血病模型组,一组为正常鼠,然后测量两组鼠脾脏 DNA 含量(mg/g),问正常鼠和白血病鼠脾脏中 DNA 含量是否不同?表 8 白血病模型鼠和正常鼠脾脏中 DNA 含量(mg/g )白血病组 12.3 13.2 13.7 15.2 15.4 15.8 16.9正常
11、组 10.8 11.6 12.3 12.7 13.5 13.5 14.8(1)SPSS 数据工作表group dna1 12.31 13.2 2 13.52 14.8(2)选用 SPSS 过程:AnalyzeCompare means Independent-Sample T test 。(3)SPSS 的结果与解释(包括 H0、H 1、检验方法、检验统计量、P 值和统计推断):H0 :1=2 H1 : 1 2 =0.05 (如果是配对 t 检验 H0 :d=0)经 Levenes 方差齐性检验,按=0.10 水准,还不能认为两组总体方差不等(F =0.72,P=0.412) ,故选择假设两总
12、体方差相等时的 t 检验结果(Equal variance assumed,即第 1 行的结果) 。经两样本 t 检验,认为两组均数的差别有统计学意义( t = 2.40,P=0.034) 。白血病鼠比正常鼠脾脏中 DNA 含量要高,均数分别为 14.64 mg/g 和 12.74 mg/g,总体均数差值的95可信区间为(0.17,3.63)mg/g。9. 对 10 例肺癌病人和 12 例矽肺(硅沉着病)0 期工人用 X 线片测量肺门横径右侧距RD 值( cm) ,结果见表。问:肺癌病人的 RD 值是否与矽肺 0 期工人的 RD 值不同。表9 肺癌病人与矽肺0期工人的RD值(cm)矽肺0期工人
13、 肺癌病人3.23 2.783.50 3.234.04 4.204.15 4.874.28 5.1254.34 6.214.47 7.184.64 8.054.75 8.564.82 9.604.955.10(1)SPSS 数据工作表group rd1 3.231 3.50 2 8.562 9.60(2)选用 SPSS 过程:AnalyzeCompare means Independent-Sample T test 。(3)SPSS 的结果与解释(检验方法、检验统计量、P 值和统计推断):经两样本 t 检验,尚不能认为肺癌病人与矽肺 0 期工人的 RD 值不同 (t = 2.16,P =0.
14、056) ,总体均数差值的 95可信区间为(- 3.30 ,0.05)cm。由于 P 值在 0.05附近,而且可信区间范围较大,可考虑增加样本例数进一步证实肺癌病人与矽肺 0 期工人的 RD 值是否不同。10.为研究女性服用某避孕药后是否影响其血清总胆固醇含量,将 20 名女性按年龄配成 10 对。每对中随机抽取一人服用新药,另一人服用安慰剂。经过一定时间后,测得血清胆固醇含量(mmol/L) 。问该新药是否影响女性血清胆固醇含量?表 10 新药组与安慰剂组血清总胆固醇含量(mmol/L )配对号 1 2 3 4 5 6 7 8 9 10新药组 X1 4.4 5.0 5.8 4.6 4.9 4
15、.8 6.0 5.9 4.3 5.1安慰剂组 X2 6.2 5.2 5.5 5.0 4.4 5.4 5.0 6.4 5.8 6.2(1)SPSS 数据工作表X1 X24.4 6.25.0 5.2 4.3 5.85.1 6.2(2)选用 SPSS 过程:Analyze Compare Means Paired-Samples T Test(3)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断)6经配对 t 检验,t =1.54,P = 0.158。还不能认为新药能够影响女性血清胆固醇含量。也可以将数据输成一列,在使用时候进行拆分 split11. 为比较两种方法对乳酸饮料中脂肪含量
16、测定结果是否不同,随机抽取了 10 份乳酸饮料制品,分别用脂肪酸水解法和哥特里罗紫法测定其结果(表 6) 。问两法测定结果是否不同?表 11 两种方法对乳酸饮料中脂肪含量的测定结果(%)编号 哥特里罗紫法 脂肪酸水解法1 0.840 0.5802 0.591 0.5093 0.674 0.5004 0.632 0.3165 0.687 0.3376 0.978 0.5177 0.750 0.4548 0.730 0.5129 1.200 0.99710 0.870 0.506(1)选用 SPSS 过程:Analyze Compare Means Paired-Samples T Test(2)
17、SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断)经配对 t 检验,t =7.93,P = 0.000 (或 P0.0005) 。可认为两种方法对脂肪含量的测定结果不同,哥特里罗紫法测定结果较高,总体均数差值的 95可信区间为(0.195, 0.350)%12. 一种评价药物有效性的方法是在给药后的某个时间记录血样或尿样中的药物浓度。假定我们要比较服药 1 小时后,从同一人身上提取的尿样标本中两类阿司匹林(A 型和 B型)的浓度。因此,在某个时间先给予一定剂量的 A 型或 B 型阿司匹林,测定 1 小时后的尿浓度;一周后,推测首次给予的阿司匹林已经从机体中清除,再给予相同剂量的另
18、一类阿司匹林,并且记录 1 小时后的尿浓度。因为给药顺序可能影响结果,所以用随机数字表决定先给哪类阿司匹林。本实验入选 10 例受试对象,结果见表。问两类药物在尿样中的浓度均值有无差别?平均差值的 95可信区间是多少?表 12 尿样中 A 型或 B 型阿司匹林 1 小时后的浓度( mg%)患者编号 A 型阿司匹林 B 型阿司匹林1 15 132 26 203 13 104 28 215 17 176 20 227 7 58 36 309 12 710 18 117(1)选用 SPSS 过程:Analyze Compare Means Paired-Samples T Test(2)SPSS 的
19、结果与解释(包括检验方法、统计量、P 值和统计推断)经配对 t 检验,t =3.67,P = 0.005。两类药物在尿样中的浓度均值有差别,A 型阿司匹林(19.20mg)高于 B 型阿司匹林(15.60mg) ;两类药物浓度的平均差值为 3.6 mg,平均差值的 95可信区间为( 1.38,5.82)mg 单样本 t-test13. 已知某小样本中含 CaCO3 的真值是 20.7mg/L。现用某法重复测定该小样本 15 次,CaCO3 含量(mg/L)分别如下。问该法测得的均数与真值有无差别?表 13 用某法重复测定小样本 CaCO3 含量(mg/L)15 次的结果20.99 20.41
20、20.62 20.75 20.10 20.00 20.80 20.9122.60 22.30 20.99 20.41 20.50 23.00 22.60(1)选用 SPSS 过程:Analyze Compare Means One-Sample T Test(2)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断)经单样本 t 检验,t = 1.70,P = 0.111。按 = 0.05 水准,尚不能认为该法测得的均数与真值不同。单因素方差分析:14. 用四种不同的饲料喂养大白鼠,每组 4 只,然后测其肝重占体重的比值(肝/体重比值,% ) ,数据如下。试比较四组均数间有无差异?表
21、 14 四组资料的肝重占体重比值(% )的测定结果A 饲料 B 饲料 C 饲料 D 饲料2.62 2.82 2.91 3.922.23 2.76 3.02 3.002.36 2.43 3.28 3.322.40 2.73 3.18 3.04(1)SPSS 数据工作表group dna1 2.621 2.23 4 3.324 3.04(2)选用 SPSS 过程:Analyze Compare means OneWay ANOVA(3)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断):经完全随机设计资料的方差分析,F=10.24,P=0.001。可认为四种不同饲料喂养大白鼠肝/ 体
22、比值的均数不同。经多个样本均数间两两比较的 SNK 检验,按=0.05 水准,可认为 C 与 D 饲料肝/体比值的均数高于 A 与 B 饲料,但尚不能认为 A 与 B 饲料,C 与 D 饲料肝/体比值的均数不同。815. 某单位欲研究 3 种药物对小白鼠肉瘤的抑制作用,将性别相同、体重相近的同一配伍组的 3 只小白鼠分别用 3 种药物抑癌,共 5 个配伍组。实验结果得瘤重(克)如下。试比较 3 种药物的抑癌作用有无差别?表 15 三种药物的抑癌作用(瘤重:克)配伍组 A B C1 0.80 0.36 0.282 0.74 0.50 0.363 0.31 0.20 0.254 0.48 0.18
23、 0.225 0.76 0.26 0.30(1)SPSS 数据工作表配伍组 药物 瘤重1 1 0.802 1 0.743 1 0.314 1 0.485 1 0.76 1 3 0.282 3 0.363 3 0.254 3 0.225 3 0.30(2)选用 SPSS 过程:Analyze General Linear Model Univariate(3)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断):A、B、C 三种药物的瘤重均数(克)分别为: 0.62, 0.30和0.28。经随机区组设计资料的方差分析,F = 16.43,P = 0.001。可认为3种药物的抑癌作用有
24、差别。经多个样本均数间两两比较的 SNK 检验,按=0.05 水准,可认为 B 和 C 药的抑抑癌作用大于 A 药,但还不能认为 B 和 C 药的抑癌作用有差别。16. 某医院用三种疗法治疗慢性喉炎,治疗结果如下。试比较其疗效。表 16 三种疗法治疗慢性喉炎的结果治疗方法 无效 好转 显效 治愈 合计综合治疗 24 26 72 186 308电子治疗仪 20 16 24 32 92清音丸 20 22 14 22 78(1)SPSS 数据工作表9group effect fre1 1 242 1 203 1 201 2 262 2 163 2 221 3 722 3 243 3 141 4 18
25、62 4 323 4 22(2)选用 SPSS 过程:Weight cases;Analyze Nonparametric Test k Independent Samples。(3)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断):经多个独立样本比较的 Kruskal-Wallis H 检验, 2 = 51.39, P = 0.000。可认为三种疗法对慢性喉炎的疗效有差别。17. 对 10 例肺癌病人和 12 例矽肺(硅沉着病)0 期工人用 X 线片测量肺门横径右侧距 RD 值( cm) ,结果见表。问:肺癌病人的 RD 值是否与矽肺 0 期工人的 RD 值不同。表17 肺癌
26、病人与矽肺0期工人的RD值(cm)矽肺0期工人 肺癌病人3.23 2.783.50 3.234.04 4.204.15 4.874.28 5.124.34 6.214.47 7.184.64 8.054.75 8.564.82 9.604.955.10(1)选用 SPSS 过程: AnalyzeNonparametric Test 2 Independent Samples。(2)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断):经两个独立样本比较的 Wilcoxon 秩和检验,Z = 1.75, P = 0.080。尚不能认为肺癌病人与矽肺 0 期工人的 RD 值不同。(备注
27、:该题选自医学统计学教材第 166 页中的例 8-3。教材中选用了单侧检验。该题如果用单侧检验,则 Z = 1.75, P = 0.040,差别有统计学意义)18. 对 12 份血清分别用原方法(检测时间 20 分钟)和新方法(检测时间 10 分钟)测谷- 丙转氨酶,结果见表。问两法所得结果有无差别?表 18 12 份血清用原法和新法测血清谷 -丙转氨酶( nmol S-1/L)结果的比较10编 号 原 法 新 法1 60 802 142 1523 195 2434 80 825 242 2406 220 2207 190 2058 25 389 212 24310 38 4411 236 2
28、0012 95 100(1)选用 SPSS 过程: AnalyzeNonparametric Test 2 Related Samples。(2)SPSS 的结果与解释(包括检验方法、统计量、P 值和统计推断):经配对样本比较的 Wilcoxon 符号秩和检验,Z = 1.91, P = 0.056。 还不能认为两法测谷-丙转氨酶结果有差别。19. 某地方病研究所调查了 8 名正常儿童的尿肌酐含量( mmol/24h) 。估计尿肌酐含量( )对其年龄( )的回归方程。YX表 20 8 名正常儿童的年龄 (岁)与尿肌酐含量 (mmol/24h)XY编号 1 2 3 4 5 6 7 8年龄 X 1
29、3 11 9 6 8 10 12 7尿肌酐含量 Y 3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65(1)SPSS 数据工作表x y13 3.5411 3.01 12 3.187 2.65(2)选用 SPSS 过程: AnalyzeRegressionLinear 。(3)SPSS 的结果与解释(1)以尿肌酐含量为应变量 Y,年龄为自变量 X 建立直线回归方程:。XY139.06.(2)计算回归系数 b,并进行假设检验:b = 0.139 ,t = 4.58 , P = 0.004 。(3)总体回归系数的 95%可信区间: (0.065,0.214)(4)相关系数 r = 0.882 ;决定系数 R2 = 0.778 。20. 两组儿童横纹肌肉瘤治疗后复发时间(月数)如下。对照组为“摘除+放疗” ,处理组为“摘除+ 放疗+ 化疗” 。试进行生存分析:(1)分别计算两组的生存率;(2)比较两组生存率曲线有无差别?