1、SAS EG 数据统计分析题库单选题1、分析教师和会计师之间收入的差异,选择什么分析方法最合适?A、卡方分析B、方差分析C、两样本 T 检验D、相关系数答案 C2、分析购买不同产品的频次时,使用以下哪个任务?A、列表数据B、汇总表C、汇总统计量D、单因子频数答案 D3、以下哪个语句可以将字符型数值 date(示例:“2001-02-19”)转换为数值类型?A、INPUT(date ,YYMMDD10.)B、PUT(date,YYMMDD10)C、INPUT(date,YYMMDD10.)D、 PUT(date,YYMMDD10)答案 A4、来自于总体的样本最主要的属性是什么?A、随机B、有代表
2、性C、正态分布D、连续分布答案 B5、统计量用于检验?A、异方差B、自相关C、解释变量线性相关D、扰动项不服从正态分布答案 B6、什么统计量用于检验解释变量之间线性相关A、标准化的残差B、统计量C、Cooks DD、膨胀系数答案 D7、连续变量右偏的情况下,中位数在均值的?A、左边B、右边C、相等D、无法判断答案 A8、代表变量离散程度的指标是?A、均值B、标准差C、最大值D、中位数答案9、解释变量是多分类变量,被解释变量是连续变量,使用什么分析方法?A、卡方分析B、方差分析C、两样本 T 检验D、相关系数答案10、如果在方差分析中有 20 个观察值,你要计算残差。那么以下哪个值会是残差和?A
3、、-20B、0C、400D、从已知信息中无法推断答案11、要进行一项研究,比较男女月均信用卡支出。可能使用哪一种统计方法?A、单样本 T 检验B、双样本 T 检验C、单因素方差分析D、双因素方差分析答案、12、你运用线性回归任务进行回归,Y 是因变量,X1 是唯一解释变量。如果 X1 的参数估计(斜率)是 0,那么当 X1=13 时,Y 的最佳预测值是?A、13B、Y 的均值C、0D、 X1 的均值答案13、方差分析表中哪个统计量是用于检验总体模型假设的?A、FB、tC、R2D、 Adjusted R2答案14、当你用跑步时间(RunTime)、年龄(Age)、跑步时脉搏( Run_Pulse
4、)以及最高脉搏(Maximum_Pulse)作为预测变量来对耗氧量(Oxygen_Consumption )进行回归时,年龄(Age)的参数估计是-2.78. 这意味着什么?A、年龄每增加一岁,耗氧量就增大 2.78.B、年龄每增加一岁,耗氧量就降低 2.78.C、年龄每增加 2.78 岁,耗氧量就翻倍。D、年龄每减少 2.78 岁,耗氧量就翻倍。答案15、在不同解释变量数量不同的模型中,以下哪个指标对选择模型没有作用?A、R2B、Adjusted R2C、MallowsCpD、 AIC答案 A16、在线性回归模型中,假设预测变量是正态分布的。A、对 B、错C、不知道答案 B17、在标准正态分
5、布的属性下,预期 95%的学生化残差处于哪两个值之间?A、-3 和 3B、-2 和 2C、-1 和 1D、 0 和 1答案 B18、共线性违反了以下哪一假设?A、误差独立B、方差不变C、误差正态分布D、以上均不是答案 D19、当样本量减小时,以下哪个情况会发生?A、卡方值增大。B、P 值增大。C、Cramers V 增大。D、 Odds Ratio 增大。答案 B20、研究者想测量两个二元变量间的相关性强度。他该使用以下哪个统计量?A、Hansel 和 Gretel 相关系数B、Mantel-Haenszel 卡方检验C、Pearson 卡方检验D、 Spearman 相关系数答案 Dpear
6、son 相关系数和 spearman 相关系数的区别:1.连续数据,正态分布,线性关系,用 pearson 相关系数是最恰当,当然用spearman 相关系数也可以,就是效率没有 pearson 相关系数高。2.上述任一条件不满足,就用 spearman 相关系数,不能用 pearson 相关系数。3.两个定序测量数据之间也用 spearman 相关系数,不能用 pearson 相关系数。21、 ROC 曲线凸向哪个角,代表模型约理想?A、左上角B、左下角C、右上角D、右下角答案 A22、添加”分配项目逻辑库“在哪个菜单下?A、文件B、编辑C、任务D、工具答案 D23、根据字符串的位置和长度取子字符串的函数是?A、SCANB、SUBSTRC、CATXD、 FIND答案 D24、下面哪个符合日期常数的格式?A、“2014-01-01“DB、“01Jan2014“dC、“2014-01-01“D、 “01Jan2014“答案 B填空题(每空 1 分,共 25):1、追加表时,必须保障两个表中各个变量的名称和(变量类型)必须一致,否则会报错。