1、统计学第 2 版2012 年 7 月课程考试考前练习题一、单项选择题1人口数与出生人数, ( A ) 。A前者是时点指标而后者是时期指标B前者是时期指标而后者是时点指标C两者都是时期指标D两者都是时点指标2对列名水平进行分析的统计量主要是( D ) 。A频数B频率C中位数D 且3指数按其采用的基期不同,可分为( D ) 。A个体指数和总指数B数量指标指数和质量指标指数C简单指数和加权指数D定基指数和环比指数4通常情况下,价格(或物量)指数如按派氏公式编制,其指数值会( A ) 。A偏小B偏大C偏大偏小不能确定D公式的选择没有影响5测度数据集中趋势的统计指标有( D ) 。A方差B极差C平均差D
2、众数6若假设形式为 ,当随机抽取一个样本,其均值大于 ,则( D ) 。010:,:H 0A肯定不拒绝原假设,但有可能犯第 类错误B有可能不拒绝原假设,但有可能犯第类错误C有可能不拒绝原假设,但有可能犯第类错误D肯定不拒绝原假设,但有可能犯第 类错误7某地 年 为 亿元,若按年均增长 的速度发展, 翻一番所需时间是( 9GP139 29%GDPB ) 。A 年以后1.B 年以后804C 年以内.D 年以内8假定总体服从正态分布,下列适用 检验统计量的场合是( C ) 。tA样本为大样本,且总体方差已知B样本为小样本,且总体方差已知1C样本为小样本,且总体方差未知D样本为大样本,且总体方差未知9
3、所谓 错误指的是( A ) 。A原假设为假,接受原假设B原假设为假,接受替换假设C原假设为真,拒绝替换假设D原假设为真,拒绝原假设10下列说法正确的是( A ) 。A异众比率的作用是衡量众数对一组数据的代表程度B异众比率越大,则众数的代表性越好C异众比率不宜用来比较不同总体D定类尺度数据不能计算异众比率11抛掷一枚均匀的硬币,出现正面的概率是( C ) 。A 0B 1.C 5D12对于线性回归模型 估计参数后形成的方差分析表如下:iii uXY210离 差 来 源 平 方 和 自 由 度 均 方 和 回 归 平 方 和 100 2 500 残 差 平 方 和 200 25 80 总 平 方 和
4、 1200 27 则该回归方程的判定系数为( C ) 。A 0.167B 4C .83D 913下面哪一个符合概率分布的要求( A ) 。A)3,21(6xXPB,4C)3,1(xXPD),(8214在双侧检验中,如果将两侧的面积之和定义为 值,则对于给定的显著性水平 ,拒P绝原假设的条件是( D ) 。A 2PB 2C 2PD 15当正态总体的方差未知时,且为小样本条件下,估计总体均值使用的分布是( B ) 。A正态分布B 分布tC 分布2D 分布F16设因素的水平个数为 ,全部观测值的个数为 ,组内平方和的自由度为( B ) 。knA kB 1C nD17当置信水平一定时,置信区间的宽度(
5、 A ) 。A随着样本容量的增大而减小B随着样本容量的增大而增大C与样本容量的大小无关D与样本容量的平方根成正比18一项关于大学生体重的调查显示,男生的平均体重为 公斤,标准差为 公斤;女生605的平均体重为 公斤,标准差为 公斤。据此数据可以推断( A ) 。505A女生体重的差异较大B男生体重的差异较大C男生和女生的体重差异相同D无法判断19总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以( A ) 。A样本均值的抽样标准差B样本标准差C样本方差D总体标准差20在方差分析中,如果拒绝原假设,则意味着( A ) 。A所检验的各总体均值之间不全相等B所检
6、验的各总体均值之间全不相等C所检验的各样本均值之间不全相等D所检验的各样本均值之间全不相等21若两个变量的相关系数为 ,则下列说法正确的是( B ) 。0A两个变量没有相关关系只有函数关系B两个变量还可能有非线性关系C两个变量还可能有线性关系D两个变量没有任何关系22每次试验成功的概率为 , ,则在 次独立的重复试验中,至少失败一次的概p103率为( B ) 。3A )1(3pB 2C 31pD 23指数按其考察对象的范围不同,可分为( A ) 。A个体指数和总指数B数量指标指数和质量指标指数C简单指数和加权指数D定基指数和环比指数24对某地区人口按年龄分组如下: 岁以下、 岁、 岁、 岁、4
7、847965890岁、 岁以上。第一组与最后一组的组中值分别为( C ) 。9010A 岁和 岁5.4B 岁和 岁2C 岁和 岁D 岁和 岁.1025必然会发生的事件发生的概率是( D ) 。AB .C 50D 126变量值减去均值后再除以标准差可得到( C ) 。A偏态系数B峰度系数C标准得分D平均差27设连续型随机变量 的分布函数是 ,密度函数是 ,则对于任意实数 ,有X)(XF)(xp( C ) 。)(XPA (FB xpC 0D以上都不对4二、填空题1. 重叠组限对于越大越好的变量按“_“ 的原则归组,而对于越小越好的变量则应按照“_“的原则归组。解答:上限不包括在内;下限不包括在内2
8、. 加权平均指数是以某一时期的_为权数对_加权平均计算出来的。解答:总量;个体指数3. 抽样误差是由于抽样的随机性引起的样本结果与_之间的误差。解答:总体真值4. 在方差分析中,所要检验的对象称为因子,因子的不同表现称为_。解答:处理或者水平5. 影响次数分布的要素可分为_、_、_和_。解答:组数;组距;组限;组中值6. 在无交互作用的双因素方差分析中,总离差平方和 可以分解为 、_和_STSA三项。解答:,SBE7. 正态分布的概率密度函数曲线为一对称钟形曲线,曲线的中心由_决定,曲线的陡峭程度由_决定。解答:均值 ;方差 或者标准差28. 在线性回归分析中,只涉及一个自变量的回归称作_;涉
9、及多个自变量的回归称作_。解答:一元线性回归;多元线性回归9. 某地区 年的发电能力为 万千瓦,要求到本世纪末发电能力翻 番,则到 年的19090 420发电能力为_万千瓦。解答:140510. 数据的误差包括:_、_、_。解答:抽样误差、未响应误差、响应误差11. 检验一个正态总体的方差时所使用的分布是_。解答:分布212. 描述数据的离散趋势的统计量主要有异众比率、极差、四分位差、平均差、_、标准差、_。解答:方差、离散系数6三、简答题1. 统计数据可以划分为哪几种类型?分别举例说明。解答:统计数据按照所采用计量尺度的不同可划分为三种类型。一种是数值型数据,是指用数字尺度测量的观察值。例如
10、,每天进出海关的旅游人数,某地流动人口的数量等。数值型数据的表现就是具体的数值,统计处理中的大多数都是数值型数据;另一种是分类型数据,是指对数字进行分类的结果,例如人口按性别分为男、女两类,受教育程度也可以按不同类别来区分;再一种是顺序型数据,是指数据不仅是分类的,而且类别是有序的,例如满意度调查中的选项有“非常满意 “,“比较满意“,“比较不满意“,“非常不满意“ ,等。在这三类数据中,数值型数据由于说明了事物的数量特征,因此可归为定量数据,分类型数据和顺序型数据由于定义了事物所属的类别,说明了事物的品质特征,因而可统称为定性数据。2. 为什么在点估计的基础上还要引进区间估计?区间估计中各相
11、关要素的含义和作用是什么?解答:点估计的方法就是用一个确定的值去估计未知参数,表面看起来很精确,实际上把握程度不高。因为估计量是来自一个随机抽取的样本,总是带有随机性或偶然性,样本估计量 恰好等于 的可能性是很小的;而且点估计并未给出估计精度和可信程度。但估计在某一小区间内,并给出估计的精度和可靠度,则把握程度就高多了。这种估计总体参数在某一区间内的方法称作区间估计。如果用数学语言来描述区间估计,则应该是这样的:设 是抽自密度为 的一个样本,对于给定的 ,如能求得统计量 和nX,21 ),(xf 10,使 ,则称 为 的置信度为 的置信区间,它表达了区间估计1)(P、 1的准确性或精确性; 和
12、 均为样本估计量的函数,分别称作置信下限和置信上限;称作置信度或信度或置信概率或置信水平或概率保证程度,它是区间估计可靠性的概1率; 称为显著性水平,它表达了区间估计不可靠的概率。总之,区间估计可以克服点估计的不足,因而实际应用意义较大。3. 试回答描述数据的集中趋势的统计量有哪些?并对这些统计量的特点加以比较。解答:常用的描述集中趋势的统计量主要有均值、中位数、众数。(1)均值又分为算术平均数、调和平均数和几何平均数。未经分组整理的原始数据,其算术平均数的计算就是直接将一组数据的各个数值相加除以数值个数,称为简单算术平均数。根据分组整理的数据计算的算术平均数,就要以各组变量值出现的次数或频数
13、为权数计算加权的算术平均数。(2)调和平均数也称倒数平均数或调和均值。调和平均数和算术平均数在本质上是一致的,实际应用时,当计算算术平均数其分子资料未知时,就采用加权算术平均数计算均值,分母资料未知时,就采用加权调和平均数计算均值。(3)几何平均数也称几何均值,通常用来计算平均比率和平均速度。(4)中位数是将变量取值按大小顺序排列后,处于中间位置的那个变量值。中位数很好的代表了一组数据的中间位置,对极端值并不敏感。由于中位数只是数据中间位置的代7表取值,因此中位数并没有利用数据的所有信息,其对原始数据信息的代表性不如均值。(5)众数是指一组数据中出现次数最多的变量值。众数具有不唯一性。均值、中
14、位数、众数是描述数据集中趋势的主要统计量,它们按照不同的方法来确定,具有不同的特点和应用场合;但是,三者之间存在着一定的数量关系,这种数量关系取决于变量取值的频数分布状况。从分布的角度看,均值是一组数据全部数值的平均数,中位数是处于一组数据中间位置上的数值,众数始终是一组数据分布的最高峰值。对于具有单峰分布的大多数数据而言,均值、中位数、众数存在以下关系:当变量取值的频数分布对称时,则均值与众数、中位数三者完全相等,即 ;oeMx当变量取值的频数分布呈现右偏时,三者之间的关系为 ;oeMx当变量取值的频数分布呈现左偏时,三者之间的关系为 。从上面的关系我们可以看出,当频数分布呈对称分布或近似对
15、称分布时,以均值、中位数或众数来描述数据的集中趋势都比较理想;当频数分布呈偏态时,极端值会对均值产生较大影响,而对众数、中位数没有影响,此时,用众数、中位数来描述集中趋势比较好。均值不适用于定性数据。均值的优点在于它对变量的每一个取值都加以利用;缺点在于其统计量的稳健性较差,即容易受到极端值的干扰。对于偏态分布的数据,均值的代表性较差。因此,当数据分布的偏斜程度很大时,可以考虑选择中位数或众数作为集中趋势的代表。4. 简述应用方差分析的条件解答:应用方差分析要求符合两个条件:(1)各个水平的观察数据,要能看作是从服从正态分布的总体中随机抽取的样本。(2)各组观察数据是从具有相同方差的相互独立的
16、总体中抽得的。5. 假设检验依据的基本原理是什么?解答:假设检验依据的基本原理是小概率原理。所谓小概率原理是指,若一个事件发生的概率很小,在一次试验中就几乎是不可能发生的。根据这一原理,如果在试验中很小概率的事件发生了,我们就有理由怀疑原来的假设是否成立,从而拒绝原假设。6. 时间序列的变动可分解为哪些成分?分别描述这些成分的特点。解答:时间序列的变动可分解为长期趋势(T) 、季节变动(S) 、循环变动(C) 、不规则变动(I)四种成分。(1)长期趋势。长期趋势是时间序列在较长时期内持续上升或下降的发展态势。这种趋势可以是线性的,也可以是非线性的。(2)季节变动。季节波动是时间序列在一年内重复
17、出现的周期性波动。季节波动中的“季节“ ,不仅指一年中的四季,还可以指一年中任何一种周期,如月、周、日、时等。季节波动多是由于自然因素和生产或生活条件的影响引起的,其波动具有重复性。(3)循环变动。循环变动是时间序列较长时间内(通常为一年以上)上下起伏的周期性波动。循环变动不同于长期趋势,它是一种涨落相间的交替波动;也不同于季节变动,它的周期长短不一、幅度高低不同,不具有重复性。循环的周期长度不同,从几年到几十8年不等。(4)不规则变动。不规则变动包含时间序列中所有没有明显规律性的变动,它是时间序列剔除长期趋势、季节变动、循环变动后的偶然性波动,又称剩余变动或随机变动。不规则变动多是由随机事件
18、或突发事件(如战争、自然灾害等)引起的。9四、计算题1. 某班 名学生统计学考试成绩分别为:406898675372685297581479757190664382学校规定: 分以下为不及格, - 为及格, - 分为中, - 分为良, - 分00000为优要求:(1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表。(2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况。解答:(1)“学生考试成绩 “为连续变量,需采组距式分组,同时学生考试成绩变动均匀,故可用等距式分组来编制变量分配数列。考试成绩 学生人数(人) 比率(%)60分以下 3 7.560-70 6 15.07
19、0-80 15 37.580-90 12 30.090-100 4 10.0合计 40 100.0(2)分组标志为考试成绩,属于数量标志,简单分组;从分配数列中可看出,该班同学不及格人数和优秀生的人数都较少,分别为 和 。大部分同学成绩集中在 -%5.71070分之间,说明该班同学成绩总体良好。90考试成绩一般用正整数表示时,可视为离散变量也可用单项式分组,但本班学生成绩波动幅度大,单项式分组只能反映成绩分布的一般情况,而组距分组分配数列可以明显看出成绩分配比较集中的趋势,便于对学生成绩分配规律性的掌握。2. 某商店两种商品的销售资料 销 售 量 单 价 ( 元 ) 商 品 单 位 基 期 计 算 期 基 期 计 算 期 甲 件 50 60 8 10 乙 公 斤 150 160 12 14 要求:(1)计算两种商品销售额及销售额变动的绝对额;(2)计算两种商品销售量总指数及由于销售量变影响销售额的绝对额;(3)计算两种商品销售价格总指数及由于价格变动影响销售额的绝对额。解答:(1)%09.128415028601qp元4