1、一 单项选择题1. 多因素方差分析中观测变量总的离差平方和不包括 ( )A. 多个控制变量单独作用引起的离差平方和B. 多个控制变量交互作用引起的离差平方和C. 其它随机因素引起的离差平方和D. 观测变量的非自然因素引起的离差平方和2. SPSS默认的字符型变量的对齐方式是 ( )A. 右对齐 B. 中间对齐 C. 左对齐 D. 以上说法都不对3. 下列函数分布中,单样本的 K-S 检验不能将一个变量的实际频数分布与之比较的是 ( )A. 泊松分布 B. 均匀分布 C. 正态分布 D. 二项分布4. SPSS中创建数据文件时不能用来作为变量名的是 ( )A. all B. abc1 C. na
2、me D. allby5. 线性回归分析对回归方程的检验不包括 ( )A. 拟合优度检验 B. 回归方程的显著性检验C. 回归系数的显著性检验 D. 回归系数的相关性检验6. SPSS曲线估计中没有提供的曲线方程有 ( )A. 指数函数 B. 三次多项式 C. 幂函数 D. 三角函数 7. 一个生产罐头食品的公司,某批500瓶罐头的中位数为498g,其含义是( 变形 )A. 500 瓶罐头的平均含量为每瓶498gB. 500 瓶罐头中,含量为498g的瓶数最多C. 500 瓶罐头中含量最多的一瓶为498gD. 250 瓶罐头的含量小于等于498g8. 下列统计量中不属于描述样本数据离散程度的是
3、 ( )A. 方差 B. 标准差 C. 众数 D. 极差9. SPSS 是一个模块化的软件,其扩充模块不包括 ( )A. SPSS Statistics Base 模块 B. Categories 模块C. Advanced Statistics 模块 D. Conjoint 模块10. 在交叉列联表分析中,SPSS 提供的相关系数的检验方法不包括 ( )A. 卡方统计检验 B. 列联系数 C. V 系数 D. S 系数11. 在系统聚类分析中,衡量样本数据与小类、小类与小类之间亲疏程度的方法不包括 ( )A. 最短距离法 B. 中间距离法C. 离差平方和 D. 平均距离法12. 再信度分析实
4、质是求同一量表在两次测试的相关系数,下列说法中错误的是 ( )A. 所测量的特质必须稳定B. 遗忘和练习的效果相同C. 两次测试期间被试者对问题的熟悉情况没有差别D. 以上说法都不正确13. 时间序列分析中利用转换菜单中的替换缺失值命令对缺失值进行补充的方法不包括 ( )A. 序列平均值 B. 临近点均值法C. 线性插值法 D. 临近点众数法14. 利用 ANOVA 进行大、中、小城市的 16 岁女性青年的平均身高的比较,结果给出 sig.=0.043,说明 ( )A. 按照0.05显著性水平,三类城市16岁女性青年的身高没有显著差别B. 按照 0.05显著性水平,三种城市16岁女性青年的身高
5、有显著差异C. 大城市和中城市16岁女性青年的平均身高没有差别利用D. 大城市和小城市16岁女性青年的平均身高没有差别利用15. 做线性回归分析得如下的模型汇总表,则以下说法正确的是 ( )A. 模型1的拟合程度最好 B. 模型2的拟合程度最好C. 模型 3的拟合程度最好 D. 无法判断16.关于 Recode 和 Automatic Recode 的说法正确的是 ( )A. 前者的码字可以自己定义 B. 后者的码字可以自己定义C. 前者的码字不可以自己定义 D. 以上说法都不对17. SPSS的主要变量类型不包括 ( )A. 数值型 B. 字符型 C. 日期型 D. 英镑型模型 R R 方
6、调整R方标准估计的误差Durbin-Watson1 .879(a) .772 .755 2.440472 .994(b) .988 .986 .583043 .997(c) .994 .993 .41783 2.06618. 下面能检验一个样本服从 的泊松分布的有 ( )2A. T检验 B. 卡方检验 C. K-S检验 D. 游程检验19. 利用线性回归分析算得回归方程式: y=80x 1-2.53x2+57x3,以下说法中错误的是 ( )A. x1、x 2 和 x3 三个因素中,x 2 是对y 影响最小的因素B. 在其它因素不变的情况下,x 1 增加1个单位,y 增加80个单位C. x2 和
7、 y 变量为正直线相关D. x1、x 2 和 x3 三个因素均对 y 有显著影响20. SPSS中无效的变量名有 ( )A. a1 B. abc1# C.*home D. cd_121. SPSS 中的缺失值的替代方式不包括 ( )A. 用变量的所有非缺失值的均数代替B. 用缺失值相邻点的非缺失值的中位数代替C. 用缺失值相邻两点的非缺失值的中点值代替 D. 用线性插值方式确定替代值22. SPSS的基本运行方式不包括 ( ) A. 程序运行方式 B. Include命令方式C. 完全窗口菜单运行方式 D. 批处理运行方式23. 某公司生产的一批10000件产品质量的众数为498g,则 ( )
8、A. 10000 件产品的平均质量为498gB. 10000 件产品中,质量为498g的件数最多C. 10000 件产品中质量最大的为498gD. 10000 件产品中有5000件的质量小于等于498g24. 下列关于方差、峰度和偏度的说法中错误的是 ( )A. 方差是所有变量值与平均数偏差平方的平均值B. 峰度是描述变量所有取值分布形态陡缓程度的统计量C. 偏度是描述变量所有取值分布对称性的统计量D. 除了偏度,方差和峰度都可以 Analyze 菜单的 Descriptives 计算25. 关于利用 Sort by 对数据排序的描述错误的有 ( )A. 排序变量可以是多个 B. 排序变量最多
9、一个C. 排序变量为多个时先按第一个排序,取值相同的再按第二个排,以此类推D. 观测个体所有变量的值都变到新位置26. SPSS 作图中,下列不属于条形图的有 ( )A. 简单条形图 B. 堆栈条形图C. 复合条形图 D. 差异区域图27. 关于样本的 T 检验和非参数检验的说法正确的有 ( )A. T检验要求样本服从或者近似服从正态分布B. 非参数检验要求样本服从或者近似服从正态分布C. 两种检验都要求样本服从或者近似服从正态分布D. 两种检验都不要求样本服从或者近似服从正态分布28. SPSS软件的编辑窗口能打开的文件类型有 ( ) A. *.st B. *.doc C. *.xls D.
10、 *.mat 29. 两个独立样本的检验若采用 cut point(如下图)对分类变量 A 进行分组,并输入数值 3,则分组的结果是 ( )A. 变量取值大于 3 的个案为一组,取值小于等于 3 的为一组B. 变量取值大于等于 3 的个案为一组,取值小于 3 的为一组C. 变量取值大于 3 的个案为一组,取值小于 3 的为一组D. 以上说法都不对30. 多个配对样本的非参数检验方法不包括 ( )A. Friendman 检验 B. Kendalls W 检验C. Cochrans Q 检验 D. Wilcoxon 检验31. 在合并a.sav 和b.sav 为ab.sav( 见下)时,是增加
11、。A. 记录 B. 变量 C. 数据 D. 表格数据表1:a.sav 数据表 2:b.sav32. 对上题的文件合并中,关键变量是 。A. 学生ID B. 性别 C. 年龄 D. 无关键变量33. 在一次抽奖活动中,欲从1000名参加活动的人员中随机抽取十位幸运参加者,下列SPSS的过程中可以使用的为 。学生ID 性别 年龄1 female 142 male 153 male 15学生ID 性别 年龄5 female 166 male 157 male 13A. Select Cases B. Compute C. Rank cases D. Automatic Recode34. 在对身高所
12、做的探索分析中,不能用来判断身高分布的正态性的图形是 。A. 茎叶图 B. 正态概率图C. 饼图 D. 离散正态概率图35. 交叉列联表分析中提供的图形分析包括 。A. 散点图 B. 饼图C. 条形图 D. 线图二双项选择题1. 下列关于判别分析的说法中正确的是 ( )A. 判别分析先根据已知类别事物的性质,用某种方法对未知类别的新事物进行判断以将之归入已知的类别中B. 按从不同角度提出问题,判别分析的判别方法包括Fisher准则、Bayes准则和 Peter准则C. 判别分析要求观测变量之间没有显著地相关性且服从正态分布D. 判别分析要求观测变量和因变量都是连续变量2. 下面关于相关样本的非
13、参数检验的说法中正确的有 ( )A. Friendman 检验要求数据为两个或更多连续字段B. Kendall 协同系数检验要求数据为两个或更多连续字段C. Cochrans Q 检验要求数据必须为两个有序字段D. McNemar 检验要求数据为三个分类字段3. 统计数据的预处理数据的选取方法包括 ( )A. 使用筛选器变量 B. 随机个案样本C. 加权平均法 D. 数据重新编码4. 下面关于创建时间序列变量的方法的说法中正确的是 ( )A. 季节性差分法产生季节性差分序列B. 先前移动法产生以当前值之前的相邻值计算的移动平均序列C. 滞后法产生差分序列D. 平滑法产生基于提前法计算的平均序列
14、5. 探索性分析中关于缺失项的设置中错误的是 ( )A. 按列表排除个案表示去除部分含缺失值的个案后再进行分析B. 按对排除个案去除当前分析变量中有缺失值的个案及与缺失值有成对关系的个案C. 按行表排除个案表示去除所有含缺失值的个案后再进行分析D. 报告值将分组变量的缺失值单独分为一组,并在频数表中输出6. 关于相关分析的说法中错误的是 ( )A. 二元定距变量的相关分析中”Flag significance correlations”表示显示统计检验的相伴概率 B. 偏相关分析中”Exclude cases pairwise” 表示剔除所有具有缺失值的个案后再分析计算C. 不相似测量的距离分
15、析中的统计量有欧氏距离、Chebychev 距离、Block 距离、Minkowski 距离和 Customized 距离等D. 相关系数是衡量变量之间相关程度的一个量值,可以取任何实数7. 下列关于聚类分析的说法中正确的有 ( )A. 如果观察值的个数多或文件非常大(通常在 100 个以上)宜采用快速聚类分析方法B. 层次聚类分析的 R 型聚类是对研究对象的观察变量进行分类,使有共 同特征的变量聚在一起C. 层次聚类分析的 Q 型聚类的图形结果有输出树形图和输出条形图D. 快速聚类分析只能产生固定类数的聚类解,类数需要用户事先指定8. 因子分析的说法中正确的 ( )A. 因子分析是用少数几个
16、因子来描述许多因素之间的联系,以较少几个因子反映原资料的大部分信息的统计学方法B. 因子分析过程中的检验方法有巴特利球形检验、反映像相关矩阵检验和 KMO 检验C. 因子分析的主成因分析法中第一主成因有最小的方差,后续成分可解释的方差越来越多D. 因子分析收敛的默认迭代次数为 50 次9. 下面关于 SPSS 的帮助系统的说法中正确的有 ( )A. Statistics Coach 适用于对 SPSS 完全不熟又急需使用的用户B. Tutorial 适用于刚接触 SPSS 希望快速学习 SPSS 操作的用户C. Syntax Guide 适用于初级和中级用户,功能比较强D. 以上说法都正确10
17、. 下列关于判别分析的说法中错误的是 ( ) A. 判别分析先根据已知类别事物的性质,用某种方法对未知类别的新事物进行判断以将之归入已知的类别中B. 判别分析的判别方式包括“Enter independent together”、 “Use stepwise method”和“Wilks lambda”三种C. 判别分析中可利用组内或组间离差矩阵对观察值分类D. 判别分析的组间均值的齐性检验的 F 值越大,WilksLambda 越大,平均数的差异越大三简答题1.SPSS 中数据视图所对应的表格与一般的电子处理软件有什么区别?答:与一般电子表格处理软件相比,SPSS 的“Data View”窗
18、口还有以下一些特性:(1)一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征;(2)行 是 观 测 , 即 每 一 行 代 表 一 个 个 体 、 一 个 观 测 、 一 个 样 品 , 在 SPSS 中称 为 事 件 ( Case) ;(3)单元包含值,即每个单元包括一个观测中的单个变量值;(4)数据文件是一张长方形的二维表。2.在 SPPS 中可以使用哪些方法输入数据? 答:SPSS 中输入数据一般有以下三种方式:(1)通过手工录入数据;(2)可以将其他电子表格软件中的数据整列(行)的复制,然后粘贴到 SPSS 中;(3)通过读入其他格式文件数据的方式输入数据
19、。3. 简述 SPSS 软件数据统计分析过程的主要项目答:主要数据统计分析项目均在分析菜单中,包括:基本统计分析 、均值比较与检验、方差分析、相关分析、回归分析、聚类与判别、因子分析、非参数检验。 4. 说明方差分析主要用途答:方差分析是用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析主要用途: 均数差别的显著性检验; 分离各有关因素并估计其对总变异的作用; 分析因素间的交互作用; 方差齐性检验。 5一组数据的分布特征可以从哪几个方面进行测度?答:一组数
20、据的分布特征可以从平均数、中位数、众数、方差、百分位、频数、峰度、偏度等方面描述。6.简述众数、中位数和均值的特点及应用场合。答:均值是总体各单位某一数量标志的平均数。平均数可应用于任何场合,比如在简单时序预测中可用一定观察期内预测目标的时间序列的均值作为下一期的预测值。中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。 在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响。众数是指一组数据中出现次
21、数最多的那个数据。它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。7.如何对两个独立样本进行均值差异检验?答:对两个独立样本进行均值差异检验需要通过两步来完成:第一,利用 F 检验判断两总体的方差是否相同;第二,根据第一步的结果,决定 T 统计量和自由度计算公式,进而对 T 检验的结论作出判断。8进行多因素方差分析时为什么要将观察变量总的离差平方和分解为 3 个部分?答:因为多因素方差分析不仅需要分析多个控制变量独立作用对观察变量的影响,还要分析多个控制变量交互作用对观察变量的影响,及其他随机变量对结果的影响。因此,
22、它需要将观察变量总的离差平方和分解为 3 个部分。9.什么是相关分析?常用的方法有哪些?答:描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程为相关分析。常用的方法有二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离相关分析。10.说明一元线性回归分析、多元线性回归分析和非线性回归分析的基本概念和功能?答:(1)一元线性回归分析,在排除其他影响因素或假定其他影响因素确定的条件下,分析某一个因素(自变量)是如何影响另一事物(因变量)的过程;(2)多元线性回归分析,在实际问题中,影响因变量的因素往往有多个,研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化
23、关系;(3)非线性回归分析,研究在非线性相关条件下,自变量对因变量的数量变化关系。四 统计分析1. 对服装销量的一个总体做 t 检验得到结果如下表:单样本 T 检验结果表则抽样服装的销量与20万件 (填“有”或“无”)显著差异。2. 使用 SPSS 做因子分析时,为了分析因子对原变量的可解释程度,得到如下的特征值与方差贡献表:如果在抽取对话框中将基于特征值的选项中将参数设置为0.6,则得到的有效因子的个数为 个。3. 将数据文件a.sav 和b.sav 合并为一个文件属于 (填“横向合并”或“纵向合并”)。数据表1:a.sav 数据表2 :b.sav4. 对三种不同的教学方法中学生成绩的协方差
24、分析表如下: Test Value = 20t dfSig. (2-tailed)Mean Difference95% Confidence Interval of the DifferenceLower Upper服装销量(万件) 4.707 14 .000 5.9893 3.2603 8.7184学生ID 性别 年龄1 female 142 male 153 male 15学生ID 科目 成绩1 语文 89 2 语文 67 3 语文 78 则不同的教学方法对数学成绩 (填“有”或“无” )显著影响。5. 某公司对员工进行了一次培训,为检验培训效果,随机地从员工中抽出 50人,欲将他们培训前
25、后的工作效率进行比较,SPSS 中可用 来判断培训前后的效率是否有显著差异。6. 一元线性回归分析得到如下回归系数表,回归方程可写为 。模 型 非 标 准 化 系 数 标 准 系 数 tSig.B标 准 误 差 试 用 版1( 常 量 ) -493.28191.356 -5.431.0国 内 生 产 总 值 .17.08.982.6.模 型 非 标 准 化 系 数 标 准 系 数标 准 误 差 试 用 版( 常 量 )国 内 生 产 总 值7. 利用 Kendall 和谐系数判定 3 个医生对一批病人评价结果的一致性的如下结果: N 6Kendal Wa .94卡 方 1.56df 2渐 近
26、显 著 性 .03a. Kendal 协 同 系 数 。卡 方渐 近 显 著 性 协 同 系 数 。则三个医生评分结果具有 (填“较差”或“较好” )的一致性。8. 下表是多重响应交叉分析的频数表,从表中可以看出,各种数码产品中,拥有 的人数最多,拥有数码产品的数量较高的是 。 sex*$dp 交 叉 制 表数 码 产 品 a 总 计数 码 相 机 数 码 摄 像机 MP3DV机sex男 计 数 151621330女 计 数 9713815总 计 计 数 24235214百 分 比 和 总 计 以 响 应 者 为 基 础 。a. 值 为 1 时 制 表 的 二 分 组 。 交 叉 制 表数 码 产 品 总 计数 码 相 机 数 码 摄 像机 机男 计 数女 计 数总 计 计 数百 分 比 和 总 计 以 响 应 者 为 基 础 。值 为 时 制 表 的 二 分 组 。9. 为了将某班学生的数学成绩与全国平均成绩比较,做 t 检验得到结果如下: