1、统计分析与 SAS 实现上机实习题 一、定量资料上机实习题 要求: ( 1) 先判断定量资料所对应的实验设计类型; ( 2) 假定资料满足参数检验的前提条件,请选用相应设计的定量资料的方差分析,并用SAS 软件实现统计计算; ( 3) 摘录主要计算结果并合理解释,给出统计学结论和专业结论。 【练习 1】取 4窝不同种系未成年的大白鼠,每窝 3只,随机分配到三个实验组中,分别注射不同剂量雌激素,经过一定时间后处死大白鼠测子宫重量,资料见表 1。问剂量和窝别的各自水平下子宫重量之间的差别有无统计学意义?若剂量间差别有统计学意义,请作两两比较。 表 1 未成年大白鼠注射不同剂量雌激素后的子宫重量 窝
2、别 子宫重量 (g) 剂量 (g/100g):0.2 0.4 0.8 合计 1 106 116 145 367 2 42 68 115 225 3 70 111 133 314 4 42 63 87 192 合计 260 358 480 1098 定量资料的 随机区组设计 (区组因素:窝别;实验因素:剂量) 【 SAS 程序】: DATA PGM15G; DO A=1 TO 4; /*A为窝别 */ DO B=1 TO 3; /*B为雌激素剂量 */ INPUT X ; /*X为子宫重量 */ OUTPUT; END; END; CARDS; 106 116 145 42 68 115 70
3、111 133 42 63 87 ; RUN; ods html; /*将结果输出成网页格式, SAS9.0以后版本可用 */ PROC GLM DATA=PGM15G; CLASS A B; MODEL X=A B / SS3; MEANS A B; /*给出因素 A、 B各水平下的均值和标准差 */ MEANS B / SNK; /*对因素 B(即剂量)各水平下的均值进行两两比较 */ RUN; ODS HTML CLOSE; 【练习 2】 一位工程师研究由钻头压力产生的冲力。考察了 A(钻孔速度)和 B(进料速度),两因素分别取 2 与 3 水平,各水平组合下均做了两次独立重复实验,资料
4、见表 2。假定资料满足参数检验的前提条件,且两因素对观测结果的影响地位平等,已知冲力越小越好,试作分析,尽可能给出较为明确的统计和专业结论。 表 2 在钻孔速度和进料速度取不同水平的条件下冲力的测定结果 钻 孔 冲力(单位) 速 度 进料速度: 0.015 0.030 0.045 125 2.70 2.45 2.60 2.78 2.49 2.72 200 2.83 2.85 2.86 2.86 2.80 2.87 两因素 2 x 3析因设计 【 SAS 程序】: DATA aaa; DO zs=125,200; DO repeat=1 TO 2; /*每种试验条件下有 2次独立重复试验 */
5、do js=0.015,0.030,0.045; INPUT cl ; OUTPUT; END; END; END; CARDS; 2.70 2.45 2.60 2.78 2.49 2.72 2.83 2.85 2.86 2.86 2.80 2.87 ; run; ods html; PROC GLM; CLASS zs js; MODEL cl=zs js zs*js / SS3; MEANS zs*js; LSMEANS zs*js / TDIFF PDIFF; /*对 zs和 js各水平组合而成的试验条件进行均数进行两两比较 */ RUN; ods html close; 二、定性资料上
6、机实习题 要求: ( 1)若题目中未给出表格,请列出标准的列联表,并对其命名; ( 2)若题目中已列出不规范的表格,先修改,然后对其命名; ( 3)根据分析目的或自己提出分析目的、资料的前提条件选用相应的统计分析方法,并用SAS 软件实现计算; ( 4)将主要计算结果摘录出来,给出统计学和专业结论。 【练习 1】 某卫生防疫站对屠宰场及肉食零售点的猪肉 ,检查其表层沙门氏菌带菌情况,结果如下表。试比较屠宰场与肉食零售点猪肉表层沙门氏菌的带菌率之间差别有无统计学意义 ? 表 1 屠宰场及肉食零售点猪肉表层沙门氏菌抽检结果 采样地点 例数 带菌率 (%) 阳性数值 阴性数值 屠宰场 2 26 7.
7、14 零售点 8 21 27.59 横断面研究设计 【 SAS 程序】: DATA PGM19A; DO A=1 TO 2; DO B=1 TO 2; INPUT F ; OUTPUT; END; END; CARDS; 2 26 8 21 ; run; ods html; PROC FREQ; WEIGHT F; TABLES A*B / CHISQ; RUN; ods html close; 【 练习 2】有人对某部门 22707 名雇员中,普查了 HBsAg,其中 3454 名阳性, 19253 名为阴性。从 1975 年起,追踪了 3 年,发现在阳性组有 40 名患了肝癌,阴性组仅一名
8、患肝癌。试选用合适的方法对资料进行全面分析。 队列研究设计 2 x 2表 【 SAS 程序】: DATA PGM19B; DO A=1 TO 2; DO B=1 TO 2; INPUT F ; OUTPUT; END; END; CARDS; 40 3414 1 19252 ; run; ods html; PROC FREQ; WEIGHT F; TABLES A*B / CHISQ cmh; RUN; ods html close; 【练习 3】 APOE-4 等位基因与老年痴呆性的关联研究:以 600 名晚发及散发老年痴呆患者和 400 名正常对照为研究对象,分析 APOE-4 等位基因
9、与老年痴呆性的关系。 表 4 APOE-4 等位基因与老年痴呆性病例对照关联研究 AGT 等位基因 例数 合计 病例组 对照组 APOE-4 240 60 300 非 APOE-4 360 340 700 合计 600 400 1000 病例对照研究设计 2 x 2表 【 SAS 程序】: ATA PGM20; DO A=1 TO 2; DO B=1 TO 2; INPUT F ; OUTPUT; END; END; CARDS; 240 60 360 340 ; run; ods html; PROC FREQ; WEIGHT F; TABLES A*B / CHISQ cmh; RUN;
10、ods html close; cac caaodd /)( 11 比数db caoddoddOR /21 dbd dbbo d d /)( 22 比数【练习 4】请分析下表资料。已从专业上认定 培养的阳性结果就是 “真阳性 ”,而不会出现假阳性。 表 3 两种培养基对同一批痰液标本同时培养 的结果 甲培养基 培养结果 例数 乙培养基结果: + - 合计 + 36 34 70 - 0 135 135 合计 36 169 205 隐含金标准配对设计 2 x 2表 配对设计 22 列联表资料总体率差异性检验统计量的计算公式 若 b+c40 时 若 b+c 40 时 【 SAS 程序】: DATA
11、PGM19F; INPUT b c; chi=(ABS(b-c)-1)*2/(b+c); p=1-PROBCHI(chi,1); chi=ROUND(chi, 0.001); IF p0.0001 THEN p=ROUND(p,0.0001); FILE PRINT; PUT #2 10 Chisq 30 P value #4 10 chi 30 p; CARDS; 34 0 ; run; ( 甲 培养基的阳性数大于 乙 培养基的阳性数) 【练习 5】请分析下表资料。 表 6 两法检查室壁收缩运动的符合情况 对比法测 冠心病人数 定的结果核素法 正常 减弱 异常 正 常 58 2 3 减 弱
12、1 42 7 异 常 8 9 17 合计 67 53 27 1)( 22 cb cb1)1( 22 cb cb双向有序且属性相同 R x C列联表( Kappa检验) 【 SAS 程序】: data aaa; do a=1 to 3; do b=1 to 3; input f ; output; end; end; cards; 58 2 3 1 42 7 8 9 17 ; run; ods html; *简单 kappa检验 ; proc freq data=aaa; weight f; tables a*b; test kappa; run; *加权 kappa检验 ; proc freq
13、; weight f; tables a*b; test wtkap; run; ods html close; ( 两种方法的一致性检测有 统计学意义) 简单 kappa检验和 加权 kappa检验这两种方法都是用来 检验两种评价方法是否具有一致性的方法 。其主要的区别是两种方法计算的公式不一样,更具体地说是对两个变量的打分不一样,简单 kappa 检验主要是利用对角线上的信息,加权 kappa 检验除了利用对角线上的数据外,还将对角线外的数据进行加权打分,将对角线外的信息也充分利用。所以在选择方法时应根据专业知识,如果两个变量取值的界线比较明确,如 “+”“+”“+”等,这时可以选用简单的
14、 kappa 检验,如果两个变量的取值不十分明确,人为的因素较多时,就可选用加权kappa 检验。 【练习 6】请分析下表资料。 表 5 某地 6094人按 2种血型系统划分的结果 ABO 人 数 血型 MN 血型 :M N MN O 431 490 902 A 388 410 800 B 495 587 950 AB 137 179 325 合计 1451 1666 2977 双向无序 R x C列联表 (卡方或 Fisher精确检验) 【 自由度 =(行数 -1) X(列数 -1】 【 SAS 程序】: DATA PGM20A; DO A=1 TO 4; DO B=1 TO 3; INPU
15、T F ; OUTPUT; END; END; CARDS; 431 490 902 388 410 800 495 587 950 137 179 325 ; run; ods html; PROC FREQ; WEIGHT F; TABLES A*B / CHISQ;*exact; RUN; ods html close; (行变量与列变量相互独立, ) 分析方法选择 不超过 1/5 的格子理论频数 5 时,此类资料应采用 2 检验处理。 其他情形,可采用 Fisher 精确检验处理。 【练习 7】请分析下表资料。 表 7 3种药物疗效的观察结果 疗 人 数 效 药物 A B C 治愈 1
16、5 4 1 显效 49 9 15 好转 31 50 45 无效 5 22 24 合计 100 85 85 结果变量为有序变量的单向 有序 R x C列联表 【 SAS 程序】: *方法 1; DATA PGM20C; DO A=1 TO 4; DO B=1 TO 3; INPUT F ; OUTPUT; END; END; CARDS; 15 4 1 49 9 15 31 50 45 5 22 24 ; run; ods html; PROC NPAR1WAY WILCOXON; FREQ F; CLASS B; VAR A; RUN; *方法 2; proc freq data=PGM20C
17、; weight f; tables b*a/cmh scores=rank; run; ods html close; 【练习 8】请分析下表资料。 表 8 眼晶状体混浊度与年龄之关系 晶状体混 眼 数 浊 程度 年龄 20 30 40 215 131 148 + 67 101 128 + 44 63 132 合计 326 295 408 双向有序且属性不同 R x C列联表 ( spearman秩相关) 【 SAS 程序】: DATA PGM20E; DO A=1 TO 3; DO B=1 TO 3; INPUT F ; OUTPUT; END; END; CARDS; 215 131 148 67 101 128 44 63 132 ; run; ods html; PROC CORR SPEARMAN; VAR A B; FREQ F; RUN; ods html close;