1、六、计算题:(要求写出计算公式、过程,结果保留两位小数,共 4 题,每题 10 分)1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了 49 名顾客构成一个简单随机样本,调查结果为:样本平均花费为 12.6 元,标准差为 2.8 元。试以 95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(2)=0.9545) 是大样本,由中心极限定理知,样本均值的极限49n分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知: 8.2,6.1Sx045.则有: 平均误差= 0275.Z 4.0782nS极限误差 8.042nS据公式 2xZx代入数据,得该快餐店顾客的总体平均花费
2、数额 95.45%的置信区间为(11.8,13.4)3、从某一行业中随机抽取 5 家企业,所得产品产量与生产费用的数据如下:产品产量(台) xi 40 50 50 70 80生产费用(万元)y i 130 140 145 150 156要求:、利用最小二乘法求出估计的回归方程;、计算判定系数 R2。附: 108512)(i 8.39251)(iy5x.14y79512ix046512i 23051ii3 题 解 计算估计的回归方程:= =0.567 )(221xny2179054354036144.2 0.56758=111.314 10估计的回归方程为: =111.314+0.567 yx
3、计算判定系数:2221()0.567180.439xRy4、某家具公司生产三种产品的有关数据如下:总生产费用/万元产品名称基期 报告期报告期产量比基期增长(%)写字台 45.4 53.6 14.0椅子 30.0 33.8 13.5书柜 55.2 58.5 8.6计算下列指数:拉氏加权产量指数;帕氏单位成本总指数。4 题 解: 拉氏加权产量指数= 10.45.130.1865.21.60%qp 帕氏单位成本总指数= 10.3. 1.0.4.85.2qp模拟试卷(二 )一、填空题(每小题 1 分,共 10 题)1、我国人口普查的调查对象是 ,调查单位是 。2、_ 频数密度 =频数组距,它能准确反映
4、频数分布的实际状况。3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数是 。5、某地区 2005 年 1 季度完成的 GDP=30 亿元,2005 年 3 季度完成的 GDP=36 亿元,则 GDP 年度化增长率为 。6、某机关的职工工资水平今年比去年提高了 5%,职工人数增加了 2%,则该企业工资总额增长了 7.1% 。7、对回归系数的显著性检验,通常采用的是 t 检验。8、设置信水平=1-,检验的 P 值拒绝原假设应该满足的条件是 p 、 xeMoxeM
5、oxoeM3、比较两组工作成绩发现 , ,由此可推断 ( )甲 乙 甲 乙、乙组 的代表性高于甲组 、甲组 的代表性高于乙组、甲、乙组的工作均衡性相同4、通常所说的指数是指 ( )、个体指数 、动态相对数 、复杂现象总体综合变动的相对数5、抽样误差大小 ( )、不可事先计算,但能控制 、能够控制,但不能消灭 、能够控制和消灭6、某人持有一种股票,连续三年皆获益,但三年的收益率皆不同,要计算这三年的平均收益率应采用的方法为 ( )、算术平均数 、中位数 、几何平均数7、某企业生产属连续性生产,为了检查产品质量,在每天生产过程中每隔一小时抽取一件产品进行检验.这种抽样方式是 ( )、简单随机抽样
6、、分层抽样 、等距抽样8、在假设检验中,若 ,则此检验是 ( )50:,50:10H、左侧检验 、右侧检验 、双侧检验9、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。在乘法模型中,季节指数是以其平均数等于什么为条件而构成的? ( )、100% 、400% 、1200%10、某专家小组成员的年龄分别为 29,45,35,43,45,58,他们年龄的中位数为 ( )、45 、40 、4411、若直线回归方程中的回归系数 为负数,则 ( )1、 为 0 、 为负数 、 为正数rrr12、当分布数列中各变量值的频率相等时 ( )、该数列众数等于中位数 、该数列众数等于算术均值 、该数列无
7、众数13、某次考试学生的考试成绩 近似服从正态分布, ,则可认为有大约 68.26%的学生考试X64,78NX成绩分布的范围是 ( )、(70,80) 、(70,86) 、(62,94) 14、某班有 40 名学生,其中男女学生各占一半,则该班学生的成数方差为 ( )、50% 、25% 、20% 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 2 3 4 5 6 7 三、多项选择题:(在下列备选答案中,有一个以上正确答案,请将其全部选出并把顺序号填入括号内。共 7 题,每题 2 分。)1、二手数据审核的主要内容是数据的 ( ) 、适用性 、时效性 、准确性2、下列命题正确
8、的有 ( )、样本容量与置信水平与正比 、样本容量与总体方差成反比、样本容量与边际误差成反比3、统计中计算数值型数据的平均数时,依据资料的不同,平均数的计算形式有 ( )、算术平均数 、移动平均数 、调和平均数4、某商业企业今年与去年相比,各种商品的价格总指数为 117.5%,这一结果说明 ( )、商品零售价格平均上涨了 17.5% 、商品零售量平均上涨了 17.5%、由于价格提高使零售额增长了 17.5%5、指出下列表述中哪些肯定是错误的 ( )、 、 1.,3.10rxy 8.0,5.2304rxy、 6586、区间估计 ( )、没有考虑抽样误差大小 、考虑了抽样误差大小 、能说明估计结论
9、的可靠程度7、回归分析中 ( )、t 检验是双侧检验 、F 检验是检验回归方程的显著性、在一元线性回归分析中,t 检验和 F 检验是等价的 四、判断题:(判断命题的正误,对的,在题干前的括号内打号;错的,在题干前的括号内打号。共 10 题,每题 1 分。)1 2 3 4 5 6 7 8 9 10 ( Y)1、统计要说明现象总体的数量特征,必须要先搜集该总体中的全部个体的数据。( Y)2、询问调查属于定性方法,它通常围绕一个特定的主题取得有关定性资料。( Y)3、箱线图主要展示分组的数值型数据的分布。( N )4、异众比率主要用于衡量中位数对一组数据的代表程度。( N )5、统计数据的误差通常有
10、抽样误差和非抽样误差两类。( N)6、若一组数据的均值是 450,则所有的观测值都在 450 周围。( Y)7、移动平均不仅能消除季节变动,还能消除不规则变动。( N)8、右侧检验中,如果 P 值,则拒绝 H0。( Y)9、 r=0 说明两个变量之间不存在相关关系。( Y)10、方差分析是为了推断多个总体的方差是否相等而进行的假设检验。五、简要回答下列问题(共 2 题,每题 6 分。)2、根据下面的方差分析表回答有关的问题:方差分析差异源 SS df MS F P-value F crit组间 0.001053 2 0.000527 32.91667 1.34E-05 3.88529组内 0.
11、000192 12 0.000016总计 0.001245 14注:试验因素 A 有三个水平。写出原假设及备择假设;写出 SST,SSA,SSE, ,MSA,MSE,n 以及 P 值;eATf,判断因素 A 是否显著。答案 原假设 3210:H备择假设 不全等,i SST=0.001245 SSA=0.001053 SSE=0.000192 14Tf2AfMSA=0.000527 MSE=0.000016 12ef 15nP 值=1.34E-05 F 值=32.91667 829.31,F拒绝原假设,因素 A 显著。 六、计算题:(要求写出计算公式、过程,结果保留两位小数,共 4 题,每题 1
12、0 分)1、某小区居民共有居民 500 户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了 50 户,其中有 32 户赞成,18 户反对。(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为 95.45%(Z /2 =2)(2)如果小区管理者预计赞成的比例能达到 80%,应抽取多少户进行调查?(设边际误差 E=0.08)1 题 解:(1) n = 50 p = 32/50 =64%E= 20.64321.58%1.58042,7.置 信 区 间 为 即2210.8() 10pnE应抽取 100 户进行调查。 2、下面是某商店过去 9 周的营业额数据:周
13、序号1 2 3 4 5 6 7 8 9营业额473 470 481 449 544 601 587 644 660(1)采用指数平滑法(平滑系数 =0.5)预测第十周的营业额(F 8=555.19);(2)若经过计算,平滑系数 =0.5 时误差均方=3847.31,平滑系数 =0.3 时误差均方=5112.92,问用哪一个平滑系数预测更合适?2 题 解: 1099988210 82()()(1).56.05640.5.1962.80FYF(2)平滑系数 =0.5 时误差均方=3847.31平滑系数=0.3 时误差均方=5112.92用平滑系数 =0.5 预测更合适。3、某汽车生产商欲了解广告费
14、用 x 对销售量 y 的影响,收集了过去 12 年的有关数据。通过计算得到下面的有关结果:方差分析表变差来源 df SS MS F Significance F回归 1 A 1422708.6 C 2.17E-09残差 10 220158.07 B总计 11 1642866.67参数估计表Coefficients 标准误差 t Stat P-valueIntercept 363.6891 62.45529 5.823191 0.000168X Variable 1 1.420211 0.071091 19.97749 2.17E-09求 A、B、C 的值;销售量的变差中有多少是由于广告费用的变
15、动引起的?销售量与广告费用之间的相关系数是多少?写出估计的回归方程并解释回归系数的实际意义。检验线性关系的显著性 (a=0.05 )3 题 解(1)A=SSR / 1=1422708.6 B=SSE / (n-2)=220158.07/10=22015.807C=MSR / MSE=1422708.6/22015.807=64.6221 (2) 142708.6.%SRT表明销售量的变差中有 88.60%是由于广告费用的变动引起的。(3) 20.86.93R(4)估计的回归方程:3.1.42yx回归系数 表示广告费用每增加一个单位,销售量平均增加 1.420211 个单位。 120(5)检验线
16、性关系的显著性:H0 : 1Significance F=2.17E-09=0.05拒绝 H0, , 线性关系显著。 4、某企业三种产品的出口价及出口量资料如下:出口价 出口量基期 p0 报告期 p1 基期 q0 报告期 q1甲 100 150 80 82乙 80 140 800 1000丙 120 120 60 65(1)计算拉氏出口量指数;(2)计算帕氏出口价指数4 题 解:0110820126590() 12.%7542 6.7qpI统计学试卷及答案(三)一、 判断题1统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。( )2统计研究的过程包括数据收集
17、、数据整理、分析数据和解释数据四个阶段。( ) 3统计数据误差分为抽样误差和非抽样误差。( )4按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据( )5用来描述样本特征的概括性数字度量称为参数。( )6如果数据呈左偏分布,则众数、中位数和均值的关系为:均值中位数众数。( )7通过散点图可以判断两个变量之间有无相关关系。( )8所有可能样本均值的数学期望等于总体均值。( )9影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变动四种。( ) 10狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一种特殊相对数。( ) 二、单项选择题 1D 2.C 3.B 4
18、.C 5.B 6.C 7.A 8.C 9.B 10.B 11.B 12.C 13.C 14.B 15.B1为了估计全国高中生的平均身高,从 20 个城市选取了 100 所中学进行调查。在该项研究中样本是( )。A 100 所中学 B 20 个城市 C 全国的高中生 D 100 所中学的高中生 2一名统计学专业的学生为了完成其统计作业,在统计年鉴中找到的 2005 年城镇家庭的人均收入数据。这一数据属于( )。A 分类数据 B 顺序数据 C 截面数据 D 时间序列数据 3某连续变量数列,其首组为 50 以下。又知其邻近组的组中值为 75,则首组的组中值为( )A 24 B 25 C 26 D 2
19、74两组数据相比较( )。A 标准差大的离散程度也就大 B 标准差大的离散程度就小C 离散系数大的离散程度也就大 D 离散系数大的离散程度就小 5在下列指数中,属于质量指数的是( )。A 产量指数 B 单位产品成本指数 C 生产工时指数 D 销售量指数6定基增长速度与环比增长速度的关系为( )。A 定基增长速度等于相应的各个环比增长速度的算术和 B 定基增长速度等于相应的各个环比增长速度的连乘积 C 定基增长速度等于相应的各个环比增长速度加 1 后的连乘积再减 1 D 定基增长速度等于相应的各个环比增长速度的连乘积加 1(或 100%)7某企业报告期产量比基期增长了 10%,生产费用增长了 8
20、%,则其产品单位成本降低了( )。A 1.8% B 2.5% C 20% D 18%8用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低 50%,在其他条件不变的情况下,则样本容量需要扩大到原来的( )。A 2 倍 B 3 倍 C 4 倍 D 5 倍9如果变量 x 和变量 y 之间的相关系数为1,这说明两个变量之间是( )。A 低度相关关系 B 完全相关关系 C 高度相关关系 D 完全不相关10合理施肥量与农作物亩产量之间的关系是( )。A 函数关系 B 相关关系 C 没有关系 D 正比例关系11在回归分析中,描述因变量 如何依赖自变量 和误差项 的方程称为( )。 yxA 回归方程
21、B 回归模型 C 估计的回归方程 D 理论回归方程12平均指标是用来反映一组数据分布的( )的指标。A 相关程度 B 离散程度 C 集中程度 D 离差程度13在正态总体方差已知时,在小样本条件下,总体均值在 1- 置信水平下的置信区间可以写为( )。A B C D nzx2ntx2nzx2nszx214在其他条件不变的情况下,降低估计的置信水平,其估计的置信区间将( )。A 变宽 B 变窄 C 保持不变 D 无法确定15在同等条件下,重复抽样误差和不重复抽样误差相比( )。A 两者相等 B 前者大于后者 C 前者小于后者 D 无法判断三、 多项选择题1按计量尺度不同,统计数据可分为三类即( )
22、A 时间序列数据 B 实验数据 C 分类数据 D 顺序数据 E 数值型数据2统计调查方案的内容包括( )。A 确定调查目的 B 确定调查对象和调查单位 C 设计调查项目和调查表D 调查所采用的方式和方法 E 调查时间及调查组织和实施的具体细则3反映分类数据的图示方法包括( )。A 条形图 B 直方图 C 圆饼图 D 累积频数分布图 E 茎叶图4具有相关关系的有( )。A 工号和工作效率 B 受教育程度与收入水平 C 子女身高和父母身高D 收入水平与消费量 E 人口与物价水平 5下列属于时期数列的有( )。A 某商店各月库存数 B 某商店各月的销售额 C 某企业历年产品产量 D 某企业某年内各季
23、度产值 E 某企业某年各月末人数1.CDE 2. ABCDE 3.AC 4.BCD 5.BCD五、计算分析题1从一个正态总体中随机抽取样本容量为 8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值 95%的置信区间。(已知 )。(12 分)365.2)18(025.t1解:已知 n=8,总体服从正态分布, 未知,样本抽样分布服从 t 分布 .108nx46.3)(2s89.5.2ntE置信下限=10-2.89=7.11置信上限=10+2.89=12.89总体均值 的 95%的置信区间为 7.11,12.892已知某企业连续 5 年钢产量资料如下:年份 1997 1998 1999 2000 2001钢产量(千吨) 200 240 360 540 756环比 -发展速度(%)定基环比增长速度(%)定基试根据上表资料填出表中数字。(注意没有的数字划“”,不准有空格)(10 分)3某商场出售三种商品销售资料如下表所示:(14 分)销售量 q价 格 (元)p销售额(元)商品名称计量单位 基期q0报告期q1基期p0报告期p1p0q0 p1q1 p0q1甲乙台件10025012030080188220