1、 SPSS 操作指南一、SPSS 数据的结构和定义方法(variable view)1、变量名(Name)2、数据类型、宽度、列宽度(1)数值型。例如工资、年龄、成绩的取值。包括标准型(numeric) 、科学计数法型( Scientific notation) 、逗号型(comma) 、圆点型(Dot ) 、美元符号型(Dollar ) 、用户自定义型(Custom Currency) 。(2)字符型(string) 。例如职工号码、姓名、性别等。(3)日期型(Date) 。用来表示日期或时间。3、变量名标签(Label)对变量名含义的进一步解释说明。4、变量值标签(value labels
2、)对变量取值含义的解释说明信息,对于品质型数据尤为重要。例如 1 表示男,2 表示女。5、缺失数据(missing )对于收集上来的数据有缺失或异常值的处理。字符型变量或数值型变量,可以是 1 至 3 个特定的离散值(discrete missingvalues)数值型变量,哟过户缺失值可以在一个连续的闭区间内并同时再附加一个区间以外的离散值(Range plus one optional discrete)6、度量尺度(measure )定距型数据(Scale) ,通常是指诸如身高、体重、收入等的连续型数据。也包括诸如人数、商品件数等离散型数据。包括了等距量表和等比量表。定序型数据(ordi
3、nal )具有内在的固有大小或高低顺序,不同于定距型数据,一般可以用数值或字符表示。如职称变量可以有低级、中级、高级三个取值,可以分别为 1、2 和 3 表示。定类型数据(norminal )没有内在固有大小或高低顺序,一般以数值或字符表示的分类数据。如性别、民族等。操作:仔细看看居民储蓄的数据,理解数据结构的含义。二、分类汇总的操作界面调整至左下角的 data view。1、分类汇总按照某分类进行分类汇总计算。例如想知道不同户口的居民取款金额是否较大差距。例如不同年级学生的平均满意度。步骤:1)dataAggregate,出现如下图对话框:2)分类变量选到 break variables3)
4、汇总变量选到 Aggregate Variables4) 单击 Function 按钮,指定对汇总变量计算哪些统计量。SPSS 默认计算均值。5)指定分类汇总结结果保存到何处。有两种选择:第一、Create new data file,表示将结果存放到系统默认的名为 aggr.sav 的 SPSS 数据文件中,可以单击 File按钮,重新指定文件名;第二,Replace working data file,表示用分类汇总结果覆盖数据编辑窗口中的数据。一般选择前一种方式。6)单击 Name&label 按钮,重新指定结果文件中的变量名或添加变量名标签,SPSS 默认的变量名为原变量名后加-1.7
5、)希望在结果文件中保存各分类组的个案数,选择 Save number of case in break group as variable。可以选择多个变量分类。练习:按照职业对存取款进行分类汇总。2、数据分组组距组数的确定需要按照统计学的知识确定。需要确定 1)指定分组变量;2)定义分组区间;3)指定存放分组结果的变量,一种是用分组变量值覆盖原变量(into same variables),另一种是将分组结果存到一个新变量中( into different variables) 。通常用第二种。步骤:1)选择菜单 Transform recode into different variabl
6、es,出现如下图的对话框。2)将分组变量选择到 numeric variable output 框中。本例选择的是存取款水平,注意对数值型变量变量分组。3)在 Output Variable 后输入存放分组结果的变量名,并单击 Change 按钮确认可以在 Label 后输入相应的变量名标签。4)单击 old and new values 按钮进行分组区间定义,窗口如下。注意 range 有三个选项,第一个是封闭区间,后面两个是开口组,注意观察,哪个是第一组,哪个是最后一组。5)如果仅对符合一定条件下的个案分组,则单击 if 按钮并输入 spss 条件。否则,本步可以略去。6)这样可以得到分组
7、后的取款变量。3、数据拆分SPSS 的数据拆分与数据排序很相似,但也有一个重要的不同点,即数据拆分不仅是按指定变量进行简单排序,更重要的是根据变量对数据进行分组,为以后所进行的分组统计分析提供便利。步骤:1)选择菜单 Data Split file,于是出现如下图所示的窗口。2)将拆分变量选择到 Groups Based on 框中。3)拆分会使后面的分组统计产生两种不同格式的结果。其中,Compare groups 表示将分组统计结果输出在同一张表格中,以便于不同组之间的比较;Organizer output by groups 表示将分组统计结果分别输出在不同的表格中。通常选择第一种输出方
8、式。4)如果数据编辑窗口中的数据已经实现安所指定的拆分变量进行了排序,则可以选择 file is already sorted 项。可以提高拆分执行的速度,否则 sort the file by grouping variables 项。说明:1) 数据拆分将对后面的分析一直起作用,即无论进行那种统计分析,都将按拆分变量的不同组别分别分析计算。如果希望对所有数据进行整体分析,则需要重新执行数据拆分,并在上图所示的窗口中选择Analyze all cases 项。2) 对数据可以进行多重拆分,类似于数据的多重排序。多重拆分的次序决定于选择拆分变量的先后顺序。4、频数分析步骤1)选择菜单 Anal
9、yze- Descriptive Statistics Frequencies,出现如下图所示窗口2)将若干频数分析变量选择到 Variables 框中3)单击 Charts 按钮选择绘制统计图形。出现如下图窗口。条形图( Bar Chart) ,饼状图(pie chart) ,直方图(Histograms) 。在 chart values 中选择面积的含义。练习:1 分析储户的户口和职业的基本情况2、分析储户一次存(取)款金额的情况,并对城镇储户和农村储户进行比较。操作说明,第一个就是简单的频数分析。第二个需要先对存(取)款金额分组,之后进行频数分析,可以了解存(取)款金额的情况。再对户口变
10、量拆分后,重新对存(取)款金额进行频数分析,则可以进行比较。5、基本描述统计步骤1)选择菜单 Analyze- Descriptive Statistics Descriptives。2)将需计算的数值型变量选择到 Variable(s)框中。3)单击 Options 按钮指定计算哪些基本描述统计量。6、交叉分组的频数分析操作步骤1)菜单选项 Analyze- Descriptive Statistics crosstabs,出现如下图窗口。2)如果进行二维列联表分析,则将行变量选择到 Row 框中,列变量选择到Column 中。如果 Row(s)和 Column(s)框中有多个变量,SPSS
11、 会将变量一一配对后产生多张而为列联表。如果进行三维或多维列联表分析,则把其他变量作为控制变量选到 Layer 框中。3)选择 Display Clustered Bar Charts 选项,指定绘制各变量交叉分组下频数分析柱形图。Suppress tables 表示不输出列联表,再仅分析行列变量间关系时可选择该选项。4)单击 cells 按钮指定列联表单元格中的输出内容。窗口如下图所示。SPSS 默认列联表单元格中只输出观测频数 Observed。为便于分析,通常还应指定输出 Percentages 框中的行百分比(Row ) ,列百分比(Column) ,总百分比(Total ) 。5)单
12、击 Format 按钮指定列联表各单元的输出排列顺序。Ascending 表示以行变量取值的升序排列,是 SPSS 的默认项;Descending 表示以行变量取值的降序排列。6)单击 Statistics 按钮指定用哪种方法分析行变量和列变量的关系。如下图所示。其中 Chi-Square 为卡方检验。点击ok后输出结果。共计三个表格一个图形。以上内容以练习1为例。摘2个表格。第一个是列联表。放入调查报告中时,需要考虑自己需要的数据,没有必要把所有的内容都放进去。第二个表格是进行检验的表格。第一列为检验统计量名称,第二列是个检验统计量的观测值,第三列是自由度,第四列是大于等于各检验统计量观测值的概率p值,其中第一行是卡方检验的结果。P=0.478 大于给定的显著性水平 0.05,因此可以认为城镇和农村储户对储蓄是否合算的看法没有显著性差异。注:上表中有个linear-by-linear,表示的是线性相关卡方,检验列联表中行列变量的线性相关性。零假设是行列变量零相关。只适用于定序型变量,不能用于定类型变量。判断方法同上,用P值与显著性水平(一般为(0.05)比较。小于0.05则认为线性关系显著。相关关系也可以用后面将要讲的相关分析进行判断。练习:1、城镇和农村储户对储蓄是否合算的认同是否一致。2、城镇和农村储户对“未来连年内收入的变化趋势”是否持相同的态度。