1、实习一SPSS统计软件概述,1. SPSS软件概述2. SPSS的启动与退出3. 数据文件的建立与保存4. 其他类型文件的读入,一、SPSS软件概述,SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。,特 点,非专业统计人员的首选统计软件,应 用,广泛的应用于统计、应用数学、经济、市场营销、心理、卫生统计、生物、企业管理、气象、社会学等领域。,二、SPSS的启动与退出,启动SPSS的界面3大窗口主菜单介绍退出,数据编辑窗口结果输出窗口程序编辑窗口,数据编辑窗口,数据编辑窗口界面数据窗口(D
2、ata View)和变量窗口(Variable View)数据窗口显示和编辑数值变量窗口定义、显示和编辑变量特征,结果输出窗口,打开结果输出窗口标题窗和内容窗显示所有的统计分析结果对输出结果的编辑,程序编辑窗口,程序编辑窗口界面Paste按钮用程序编辑窗口加快我们的工作用程序编辑窗口完成对话框无法完成的工作,10个下拉式菜单,三、数据文件的建立和保存,(一)数据编码1.定义数据项的变量名(Variable Name)2.定义数据项变量的标签(Variable Label)3.定义数据项变量值的标签(Value Labels),变量定义项目,Spss11.5中变量定义的一共有10个项目:变量名(
3、name)、变量类型(type)、变量长度(width)、小数位数(decimals)、变量标签(label)、变量值标签(values)、缺省值(missing)、变量显示宽度(columns)、变量对齐方式(align)、变量测量尺度(measure)。注意区分变量的标签(Variable Labels)与变量值的标签(Value Labels)。,1.进入数据编辑窗口 2.激活变量窗口 3.定义变量 4.保存数据文件的框架结构 5.数据录入 6.数据文件的存储,(二)建立数据文件,四、其他类型数据文件的读入,1.打开 “open file”对话框 FileOpenData2.选择指定文件
4、所在的路径3.选择相应的文件类型 “file type”4.指定文件名5.点击“打开”,1、将下表建立一个SPSS格式的数据文件,上 机 作 业,表 10年间346例大肠癌患者手术后的生存时间记录表,注:time表示从确诊到进行手术治疗的时间,实习二描述性统计分析,Frequencies过程,Frequencies过程,例1 某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、中位数M、p2.5和p97.5。4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7
5、.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6
6、.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05,步骤:首先建立数据文件,见数据文件“dguchun.sav” 对该数据文件进行分析,Analyze=Descriptive Statistics=Frequencies Variables框:选入X 单击Statistics钮: 选中Mean、Std.deviation、Median复选框,选中Percentiles复选框:输入2.5:单击
7、Add:输入97.5:单击Add: 单击Continue钮 单击Charts钮: 选中Bar charts 单击Continue钮 单击OK,数据文件见FREQ.SAV1、某乡卫生院为了解健康农民的血压水平,测得120例健康成年男子舒张压值如下,请绘制频数表、直方图,计算均数、标准差、中位数M、p2.5和p97.5。 注:频数表、直方图实习报告上不需画,只需写出其操作步骤。,上 机 作 业,实习三均数间的比较 Compare Means,One-Sample T Test 过程 Independent-Samples T Test 过程 Paired-Samples T Test 过程,One
8、-sample T Test 过程,用于检验样本所在总体均数与已知总体均数的比较,例1 已知某地成年男子的脉搏均数为72次/分,现在该地邻近山区调查了20名健康成年男子,测得其脉搏次数,请推断该山区成年男子的脉搏均数是否与该地成年男子有所不同?数据文件见pulse.sav,Analyze=Comple Means= One-sample T TestTest Variables框:选入pulseTest Value框:键入72 单击OK,Independent -Samples T Test 过程,1. 界面说明2. 结果解释,Independent-samples T Test 过程,用于进
9、行两个样本均数的比较,例2:某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X1、X2,试问两组的均数有无不同。(guchun.sav),Analyze=Compare Means=Independent-Samples T TestTest Variables框:选入guchun Grouping Variable框:选入group单击Define Groups: Group1,键入1;Group2, 键入2单击Continue钮单击OK,三、 Paired-Samples T Test 过程,1. 界面说明2. 结果解释,例3:为研究女性服用某避孕新
10、药后是否影响其血清总胆固醇,将20名女性按年龄配对,每对中随机抽取一人服用新药,另一人服用安慰剂,经过一定时间后,测得血清总胆固醇含量(mmol/L),问该新药是否影响女性血清总胆固醇?(pair.sav),Analyze=Compare Means=Paired-Samples T TestPaired Variables框:选入newdrug、placebo单击OK,实例操作1分别测得14例老年性慢性支气管炎病人及11例健康人的尿中17酮类固醇排出量(mg/dl)如下,试比较两组均数有无差别。,上 机 作 业,实例操作2某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白鼠按性别、
11、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料,一段时期后将之宰杀,测定其肝中维生素A含量(mol/L)如下,问饲料中缺乏维生素E对鼠肝中维生素A含量有无影响?,实习四 检验 Crosstabs,Crosstabs 检验,1四格表资料的c2检验结果解释 界面说明2配对资料的c2检验界面说明结果解释3行列表的c2检验界面说明结果解释,一、四格表的 检验,1界面说明2分析实例3结果解释,主要用于两个样本率的比较。,四格表资料,例1 某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作为对照组,问两种方法治疗效果有无差别?2by2.sav,步骤:,Data =weight case
12、s Weight cases by: Frequency Variable 框: count OkAnalyze= Descriptive Statistics=CrosstabsRows 框:选入drugColumns 框:选入ResultStatistics : 选中 Chi-square单击Continue钮 单击OK,二、RC表的 检验,1界面说明2分析实例3结果解释,主要用于多个样本率或构成比的比较,RC表资料,例2 下表是胃癌病因学研究中有关5种食品的真菌检验结果,试比较它们的真菌检出率?chiR-C.sav,步骤:,Data =weight cases Weight cases
13、by: Frequency Variable 框: count OkAnalyze= Descriptive Statistics=CrosstabsRows 框:选入sampleColumns 框:选入fungiStatistics : 选中 Chi-square单击Continue钮 单击OK,三、 配对资料的 检验,1. 界面说明2. 结果解释,配对资料 -(McNemar检验)。,用于配对设计的计数资料的 检验,例3 有28份咽喉涂抹标本,把每份标本依同一条件分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长情况,其结果如表,试问两种方法培养的结果有无差别?结果是否有一致性?chi
14、pair.sav,步骤:,Data=Weight Cases Weight Cases by:Freqency Variable:选入Weight 单击OK钮 Analyze=Descriptive Statistics=Crosstabs Rows框:选入乙培养基Columns框:选入甲培养基单击Statistics钮:选中McNemar复选框,单击Continue钮 单击OK钮,1.分别用两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法检出率为50%,甲乙两法阳性一致的检出率为35%。 问:两种方法何者为优?(列出四格表),上 机 作 业,实习五 相关与回归Correla
15、te and Regression,CorrelateBivariate 过程 Regressionlinear过程,一、Bivariate过程,1界面说明2分析实例3结果解释,例1 某地一年级12名女大学生的体重和肺活量的数据如下,试分析两者有无关系。(corr.sav),步骤:,Graphs =Scatter =Simple Y Axis :lung X Axis :weight OKAnalyze=Correlate=BivariateVariables框:选入weight 、lung选中Pearson Spearman单击OK,二、 Linear过程,1. 界面说明2. 结果解释,例2
16、 某地一年级12名女大学生的体重和肺活量的数据如下,试分析体重对肺活量的影响,并建立回归方程。(corr.sav),步骤:,Analyze=Regression=LinearDependent框:选入 lungIndependent 框: weight单击OK Method 下拉列表:enter 强行进入法,不作任何筛选Stepwise 逐步法,根据设定的纳入和排除标准进行变量筛选Remove 强迫剔除法,根据设定的条件剔除自变量Backward 后退法,只出不进Forward 前进法,只进不出,1.某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分析与回归分析。,上 机 作 业,实习六计算器的使用,