1、. . 统计学原理作业(一) (第一第三章) 一、判断题 1、社会经济统计工作的研究对象是社会经济现象总体的数量方面。 ( ) 2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。( ) 3、全面调查包括普查和统计报表。( ) 4、统计分组的关键是确定组限和组距( ) 5、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。 () 6、我国的人口普查每十年进行一次,因此它是一种连续性调查方法。 () 7、对全国各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调 查。 ( ) 8、对某市工程技术人员进行普查,该市工程技术人员
2、的工资收入水平是数量标志。() 9、对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生长的基本情况,这种调查是重点调查。() 10、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。 ( ) 二、单项选择题 、设某地区有家工业企业,要研究这些企业的产品生产情况,总体单位是(C ) 、每个工业企业; 、家工业企业; 、每一件产品; 、全部工业产品 2、某市工业企业 2003 年生产经营成果年报呈报时间规定在 2004 年 1 月 31 日,则调查期限为(B ) 。 A、一日 B、一个月 C、一年 D、一年零一个月 3、在全国人口普查中(B ) 。 A、男性是品质标志 B、人的年
3、龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 4、某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是( D ) 。 A、二者均为离散变量 B、二者均为连续变量 C、前者为连续变量,后者为离散变量 D、前者为离散变量,后者为连续变量 5、下列调查中,调查单位与填报单位一致的是( D ) A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 6、抽样调查与重点调查的主要区别是( D ) 。 A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 7、下列调查属于不连续调查的是( A ) 。 A、每月统计商品库存额 B、每旬统计产品产
4、量 C、每月统计商品销售额 D、每季统计进出口贸易额 8、全面调查与非全面调查的划分是以( C ) A、时间是否连续来划分的 B、最后取得的资料是否完全来划分的 C、调查对象所包括的单位是否完全来划分的 D、调查组织规模的大小划分的 9、下列分组中哪个是按品质标志分组( B ) 、企业按年生产能力分组 、产品按品种分组 、家庭按年收入水平分组 、人口按年龄分组 三、多项选择题 、总体单位是总体的基本组成单位,是标志的直接承担者。因此(A、D) 、在国营企业这个总体下,每个国营企业就是总体单位; 、在工业总产值这个总体下,单位总产值就是总体单位; 、在全国总人口这个总体下,一个省的总人口就是总体
5、单位; . . 、在全部工业产品这个总体下,每一个工业产品就是总体单位; 、在全部固定资产这一总体下,每个固定资产的价值就是总体单位。 、在对工业企业生产设备的调查中(B、C、E ) 、全部工业企业是调查对象; 、工业企业的全部生产设备是调查对象; 、每台生产设备是调查单位; 、每台生产设备是填报单位; 、每个工业企业是填报单位 、对连续变量与离散变量,组限的划分在技术上有不同要求,如果对企业按工人人数分组,正确的方法应是 (A、C、E ) 、人以下,人 、人以下,人(不含) 、人以下,人 、人以下,人 、人以下,人 4、在工业普查中(B、C、E ) 。 A、工业企业总数是统计总体 B、每一个
6、工业企业是总体单位 C、固定资产总额是统计指标 D、机器台数是连续变量 E、职工人数是离散变量 5、以下属于离散变量的有(B、C 、E ) 。 A:进口的粮食数量 B:洗衣机台数 C:每千人医院床位数 D:人均粮食产量 E、城乡集市个数 6、下列各项中,属于连续变量的有(A、C、D ) 。 A、基本建设投资额 B、岛屿数 C、国民生产总值中三次产业比例 D、居民生活费用价格指数 E、 就业人口 数 四、简答题 1、 统计标志和标志表现有何不同? 答:1)定义不同:单位标志简称为标志,是指总体中各单位所共同具有的属性和特征,是说明总体单位属性和 特征的名称。标志表现 是标志特征在各单位上的具体表
7、现。 2)如果说标志就是统计所要调查的项目,那么标志表现就是调查所得的结果; 3)单位式标志的承担者,标志一表现则是标志的实际体现者。 2、 如何认识统计总体和样本的关系? 答:统计总体是统计研究的具体对象,是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的、 具有膜中共同性质的许多个别单位构成的整体。样本是从中抽取出来,作为代表这一总体的部分单位组成的集 合体。抽样推断是利用样本指标来推断总体的,样本的单位必须取自全及总体;从一个全及总体可以抽取许多 个样本,而一个样本之隶属于一个总体。 3、 什么是普查?普查和全面统计报表都是全面调查,二者有何区别? 答:普查属于不连续调查,调
8、查内容主要反映国情国力方面的基本统计资料;而全面统计报表属于连续调查, 调查内容主要是需要经常掌握的各种统计资料。全面统计报表要经常填报,因此报表内容固定,调查项目较少; 而普查是专门组织的一次性调查,在调查时可以包括更多的单位,分组更细、项目更多。因此,有些社会经济 现象不可能也不需要进行经常调查,但又需要掌握比较全面、详细的资料时,就可通过普查来解决。普查花费 的人力、物力和时间较多,不宜经常组织,取得经常性的统计资料还需要靠全面统计报表。 (答案在学习指导书 P322、第 8 题) 4、 调查对象、调查单位与填报单位的关系是什么? 答:调查对象是应搜集其资料的许多单位的总体;调查单位是构
9、成调查对象的每一个单位,它是进行登记的标 志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,一般时基层企事业组织。 (答案在学习指导书 P321、第 2 题) . . 5、 单项式分组和组距式分组分别在什么情况下运用? 答:单项式分组就是以一个变量值为一组,组距式分组是以变量值变化的一个区间为一组。 变量有离散变量和两连续变量两种。历算变量可以一一列举,而连续变量是连续不断,相邻两值之间可作无限 分割。所以,离散变量可作单项式分组和组距式分组,而连续变量则只能做组距式分组。在离散变量中,当变 量值变动幅度较小时,采用单向式分组;当变量值变动幅度较大时,采用组距式分组。 (答案在学习指导
10、书 P323、第 2 题) 6、请根据第三章第二节和第三节的内容总结变量分配数列编制的步骤。 答:基本步骤为: 第一步:将原始资料按数值大小依次排列。 第二步:确定变量的类型和分组方法。 第三步:确定组数和组距。 第四步:确定组限。 第五步:汇总出个组的单位数,计算频率。病至统计表。 (学习指导书 P28) 六、计算题 1、某工业局所属各企业工人数如下:555 506 220 735 338 420 332 369 416 548 422 547 567 288 447 484 417 731 483 560 343 312 623 798 631 621 587 294 489 445 试根
11、据上述资料,要求: (1)分别编制等距及不等距的分配数列 (2)根据等距数列编制向上和向下累计的频数和频率数列。 解:1)等距分配数列 工人数 企业数(频数) 各组企业数所占比重(频率)% 200300 3 10 300400 5 167 400500 9 30 500600 7 233 600700 3 10 700800 3 10 合计 30 100 不等距分配数列 工人数 企业数(频数) 各组企业数所占比重(频率)% 200400 8 267 400500 9 30 500600 7 233 . . 600800 6 20 合计 30 100 2) 向下累计 向上累计 工人数 频繁数 累
12、计频数% 累计频率% 工人数 频繁数 累计频数% 累计频率% 300 3 3 10 200 3 30 100 400 5 8 267 300 5 27 90 500 9 17 567 400 9 22 733 600 7 24 80 500 7 13 433 700 3 27 90 600 3 6 20 800 3 30 100 700 3 3 10 合计 30 合计 30 2、某 班 40 名 学 生 统 计 学 考 试 成 绩 ( 分 ) 分 别 为 : 57 89 49 84 86 87 75 73 72 68 75 82 97 81 67 81 54 79 87 95 76 71 60
13、 90 65 76 72 70 86 85 89 89 64 57 83 81 78 87 72 61 学 校 规 定 : 60 分 以 下 为 不 及 格 , 60 70 分 为 及 格 , 70 80 分 为 中 , 80 90 分 为 良 , 90 100 分 为 优 。 要 求 : ( 1) 将 该 班 学 生 分 为 不 及 格 、 及 格 、 中 、 良 、 优 五 组 ,编 制 一 张 次 数 分 配 表 。 (2)指 出 分 组 标 志 及 类 型 ; 分 析 该 班 学 生 考 试 情 况 。 解:1、 成绩(分) 学生人数(个) 频率(比重) % 60 分以下 4 10 6
14、0-70 6 15 70-80 12 30 80-90 15 375 90 以上 3 75 合计 40 100 2 分组标志是“成绩” ,其类型是数量标志,分组方法:是变量分组中的组距式分组,而且是开口分组;本班学生 考试的成绩分布呈“两头小,中间大”的“正态分布” 。 . . 统计学原理作业(二) (第四章) 一、判断题 1、总体单位总量和总体标志总量是固定不变的,不能互相变换。 ( ) 2、相对指标都是用无名数形式表现出来的。 ( ) 3、按人口平均的粮食产量是一个平均数。 ( ) 4、在特定条件下,加权算术平均数等于简单算术平均数。 ( ) 5、用总体部分数值与总体全部数值对比求得的相对
15、指标。说明总体内部的组成状况,这个相对指标是比例相对 指标。 ( ) 6、国民收入中积累额与消费额之比为 1:3,这是一个比较相对指标。 ( ) 7、标志变异指标数值越大,说明总体中各单位标志值的变异程度就越大,则平均指标的代表性就越小。 ( ) 二、单项选择 1、总量指标数值大小(A ) A、随总体范围扩大而增大 B、随总体范围扩大而减小 C、随总体范围缩小而增大 D、与总体范围大小无关 2、直接反映总体规模大小的指标是(C ) A、平均指标 B、相对指标 C、总量指标 D、变异指标 3、总量指标按其反映的时间状况不同可以分为( D ) A、数量指标和质量指标 B、实物指标和价值指标 C、总
16、体单位总量和总体标志总量 D、时期指标和时点指标 4、由反映总体各单位数量特征的标志值汇总得出的指标是( B ) A、总体单位总量 B、总体标志总量 C、质量指标 D、相对指标 5、计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和(C ) A、小于 100% B、大于 100% C、等于 100% D、小于或大于 100% 6、相对指标数值的表现形式有 (D) A、无名数 B、实物单位与货币单位 C、有名数 D、无名数与有名数 7、下列相对数中,属于不同时期对比的指标有( B ) A、结构相对数 B、动态相对数 C、比较相对数 D、强度相对数 8、假设计划任务数是五年计划中规定最
17、后一年应达到的水平,计算计划完成程度相对指标可采用(B ) A、累计法 B、水平法 C、简单平均法 D、加权平均法 9、按照计划,今年产量比上年增加 30%,实际比计划少完成 10%,同上年比今年产量实际增长程度为( D) 。 A、75% B、40% C、13% D、17% 10、某地 2003 年轻工业增加值为重工业增加值的 90.8%,该指标为( C ) 。 A、比较相对指标 B、结构相对指标 C、比例相对指标 D、计划相对指标 11、某地区 2003 年国内生产总值为 2002 年的 108.8%,此指标为(D ) 。 A、结构相对指标 B、比较相对指标 C、比例相对指标 D、动态相对指
18、标 12、2003 年某地区下岗职工已安置了 13.7 万人,安置率达 80.6%,安置率是(D ) 。 . . A、总量指标 B、变异指标 C、平均指标 D、相对指标 三、多项选择题 1、时点指标的特点有(B、E ) 。 A、可以连续计数 B、只能间断计数 C、数值的大小与时期长短有关 D、数值可以直接相加 E、数值不能直接相加 2、时期指标的特点是指标的数值(A、D、E ) 。 A、可以连续计数 B、与时期长短无关 C、只能间断计数 D、可以直接相加 E、与时期长短有 关 3、加权算术平均数的大小受哪些因素的影响(A、B、C ) 。 A、受各组频率和频数的影响 B、受各组标志值大小的影响
19、C、受各组标志值和权数的共同影响 D、只受各组标志值大小的影响 E、只受权数的大小的影响 4、位置平均数是指( D、E ) 。 A、算术平均数 B、调和平均数 C、几何平均数 D、众数 E、中位数 5、在什么条件下,加权算术平均数等于简单算术平均数(A、D、E ) 。 A、各组次数相等 B、各组变量值不等 C、变量数列为组距数列 D、各组次数都为 1 E、各组次数占总次数的比重相等 6、中位数是(A、D、E ) 。 A、由标志值在数列中所处位置决定的 B、根据标志值出现的次数决定的 C、总体单位水平的平均值 D、总体一般水平的代表值 E、不受总体中极端数值的影响 7、标志变异指标可以( A、B
20、、 C D、E ) 。 A、反映社会经济活动过程的均衡性 B、说明变量的离中趋势 C、测定集中趋势指标的代表性 D、衡量平均数代表性的大小 E、表明生产过程的节奏性 8、下列指标属于相对指标的是( B、D、E ) 。 A、某地区平均每人生活费 245 元 B、某地区人口出生率 14.3% C、某地区粮食总产量 4000 万吨 D、某产品产量计划完成程度为 113% E、某地区人口自然增长率 11.5 四、简答: 1、 结构相对指标、比例相对指标和比较相对指标有什么不同的特点?请举例说明。 答:结构相对指标是以总体总量为比较标准,计算各组总量占总量的比重,来反映总体内部组成情况的综合指 标。如:
21、各工种的工人占全部工人的比重。比例相对指标是总体不同部分数量对比的相对数,用以分析总体范 围内各个局部之间比例关系和协调平衡状况。如:轻重工业比例。比较相对指标是不同单位的同类指标对比而 确定的相对数,用以说明同类现象在同一时期内各单位发展不平衡程度。如:甲地职工平均收入是乙地职工平 均收入的 1.3 倍。 (学习指导书 P329、第 13 题) 2、 什么是变异系数?变异系数的应用条件是什么?请写出标准差系数的计算公式。 答:变异系数是以相对数形式表示的变异指标。变异系数的应用条件是:为了对比分析不同水平的变量数列之 间标志值的变异程度,就必须消除数列水平高低的影响,这时就要计算变异系数。
22、. . 标准差系数计算公式为: (学习指导书 P331、第 20 题)xv 3、 请分别写出结构相对指标、动态相对指标和强度相对指标的计算公式并举例说明。 答:结构相对指标=各组(或部分)总量/总体总量,如第二产业增加值占国内生产总值的比重。 动态相对指标=报告期水平/基期水平,如某地区 2005 年国内生产总值是 2004 年的 112.5%。 强度相对指标=某中现象总量指标/另一个有联系而性质不同的现象总量指标,如人口密度、人均国内生产总 值。 4、 请分别写出简单算术平均数、加权算术平均数、加权调和平均数的计算公式并分别说明其应用条件。 答:简单算术平均数 它适用于未分组的统计资料;如果
23、已知各单位标志值和总体单位数,可用简,n x 单算术平均数计算。加权算术平均数 ,它适用于分组的统计资料,如果已知各组的变量值和变量f x 值出现的次数,则可用加权算术平均数。调和平均数 ,在实际工作中,有时由于缺乏总体单位数xm 资料,而不能直接计算平均数,这时就可以采用调和平均数。 五、计算题:(做题请写出计算公式和主要计算过程。计算结果保留小数) 1、某生产车间 40 名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 43 35 37 25 45 29 43 31 36 49 34 47 33 43 38 42 32 25 30 46 29 34 38 46
24、 43 39 35 40 48 33 27 28 要求:(1)根据以上资料分成如下几组:2530,3035,3540,4045,4550,计算出各组的频数和频 率,整理编制次数分布表。 (2)根据整理表计算工人生产该零件的平均日产量。 解:(1)40 名工人加工零件数次数分配表为: 按日加工零件数分组(件)x 工人数(频数) (人)f 比重(频率) (% ) 2530 7 175 3035 8 200 3540 9 225 4045 10 250 4550 6 150 合 计 40 100 (2)工人生产该零件的平均日产量 f5.47;.2;5.37;.25.741 xxx . . 方法 1、
25、 (x 取组中值) ( 件) 方法 2 (件) 答:工人生产该零件的平均日产量为 37.5 件 2、某地区销售某种商品的价格和销售量资料如下: 商品规格 销售价格( 元) 各组商品销售量占总销售量的比重() 甲 乙 丙 2030 3040 40-50 20 50 30 根据资料计算三种规格商品的平均销售价格。 解:已知: (元) 答:三种规格商品的平均价格为 36 元 3、某企业 2003 年某月份按工人劳动生产率高低分组的有关资料如下: 按工人劳动生产率分组(件/人) 生产班组 生产工人数 5060 6070 7080 8090 90 以上 3 5 8 2 2 150 100 70 30 5
26、0 试 计 算 该 企 业 工 人 平 均 劳 动 生 产 率 。 解: 95,8,75,6,54321 xxx 50,3,70,1,04321 ffff 根据公式: (件/人) 答:该企业工人平均劳动生产率为 68.25 件/人 4、某厂三个车间一季度生产情况如下: 5.37%0.15470.254%.25370.253%.75 36198. fxf 3.0%;5.0;2.0%;345;25 311 fffxx 360.f .6837059861f . . 品种 价格(元/公斤) 甲市场成交额(万元) 乙市场成交量(完公斤) 甲 乙 丙 1.2 1.4 1.5 2 2.8 1.5 2 1 1
27、 试问该农产品哪一个市场的平均价格比较高。 解:甲市场平均价格 (元/公斤)375.145.182.xm 乙市场平均价格 (元/公斤)2.f 5、甲、乙两个生产小组,甲组平均每个工人的日产量为 36 件,标准差为 9.6 件;乙组工人日产量资料如下: 日产量(件) 工人数(人) 1020 2030 3040 4050 18 39 31 12 计算乙组平均每个工人的日产量,并比较甲、乙两生产小组哪个组的日产量更有代表性? 解:已知:甲班: 6.9;311x 乙班: 45,25,1x 12,3,9,1842fff90712391845252、x702、 答:因为 ,所以甲生产小组的日产量更有代表性
28、21v .382fx6.3.1x 318.072.2x . . 统计学原理作业(三) (第五第七章) 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行的一种统计分析方法,因此不可避免的会产生误差,这种误 差的大小是不能进行控制的。 ( ) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。 ( ) 3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。 () 4、抽样误差即代表性误差和登记误差,这两种误差都是不可避免的。 () 5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。 () 6、在一定条件下,施肥
29、量与收获率是正相关关系。 ( ) 7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95 ,则乙比甲的相关程 度高。 ( ) 8、利用一个回归方程,两个变量可以互相推算( ) 二、单项选择题 1、在一定的抽样平均误差条件下( A ) 。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是( C ) 。 A、抽样误差系数 B、概率度 C、抽样平均误差 D、抽样极限误差 3、抽样平均
30、误差是( C ) 。 A、全及总体的标准差 B、样本的标准差 C、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于( C )时,成数的方差最大。 A、1 B、0 c、0.5 D、-1 5、对某行业职工收入情况进行抽样调查,得知其中 80%的职工收入在 800 元以下,抽样平均误差为 2%,当概 率为 95.45%时,该行业职工收入在 800 元以下所占比重是( C ) 。 A、等于 78% B、大于 84% c、在此 76%与 84%之间 D、小于 76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲 厂工人总数比乙厂工人总数多一倍,
31、则抽样平均误差( A ) 。 A、甲厂比乙厂大 B、乙厂比甲厂大 C、两个工厂一样大 D、无法确定 7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(B ) 。 、抽样平均误差;、抽样极限误差;、抽样误差系数;、概率度。 . . 8、如果变量 x 和变量 y 之间的相关系数为 1 ,说明两变量之间( D )。 A、不存在相关关系 B、相关程度很低 C、相关程度显著 D、完全相关 9、一般说,当居民的收入减少时,居民的储蓄款也会相应减少,二者之间的关系是( A )。 A、直线相关 B、完全相关 C、非线性相关 D、复相关 10、年劳动生产率 x(千元)和工人工资 y(元)之间的回归方程为
32、yc=30+60x ,意味着劳动生产率每提高 2 千元时, 工人工资平均增加(B )。 A、60 元 B、120 元 C、30 元 D、90 元 11、如果变量 x 和变量 y 之间的相关系数为-1,说明两个变量之间是( B) A、高度相关关系 B、完全相关关系 C、完全不相关 D、低度相关关系 12、价格不变的条件下,商品销售额和销售量之间存在着( D ) 。 A、不完全的依存关系 B、不完全的随机关系 C、完全的随机关系 D、完全的依存关系 三、多项选择题 1、影响抽样误差大小的因素有( A、B、C、D ) 。 A、抽样调查的组织形式 B、抽取样本单位的方法 C、总体被研究标志的变异程度
33、D、抽取样本单位数的多少 E、总体被研究标志的属性 2、在抽样推断中(A、C、D ) 。 A、抽样指标的数值不是唯一的 B、总体指标是一个随机变量 C、可能抽取许多个样本 D、统计量是样本变量的涵数 E、全及指标又称为统计量 3、从全及总体中抽取样本单位的方法有(B、C ) 。 A、简单随机抽样 B、重复抽样 c、不重复抽样 D、概率抽样 E、非概率抽样 4、在抽样推断中,样本单位数的多少取决于( A、B、C 、E ) 。 A、总体标准差的大小 B、允许误差的大小 C、抽样估计的把握程度 D、总体参数的大小 E、抽样方法 5、总体参数区间估计必须具备的三个要素是( B、D、E ) 。 A、样本
34、单位数 B、样本指标 c、全及指标 D、抽样误差范围 E、抽样估计的置信度 6、在抽样平均误差一定的条件下( A、D ) 。 A、扩大极限误差的范围,可以提高推断的可靠程度 B、缩小极限误差的范围,可以提高推断的可靠程度 C、扩大极限误差的范围,只能降低推断的可靠程度 D、缩小极限误差的范围,只能降低推断的可靠程度 E、扩大或缩小极限误差范围与推断的可靠程度无关 7、判定现象之间有无相关关系的方法是(A、B、C 、D ) 。 、对客观现象作定性分析 、编制相关表 、绘制相关图 、计算相关系数 、计算估计标准误 8、相关分析特点有( B、 C、D 、E )。 A.两变量不是对等的 B.两变量只能
35、算出一个相关系数 C.相关系数有正负号 D.两变量都是随机的 E.相关系数的绝对值介于 0 和 1 之间 9、下列属于负相关的现象是( A、B、D )。 A、商品流转的规模愈大,流通费用水平越低 B、流通费用率随商品销售额的增加而减少 C、国民收入随投资额的增加而增长 D、生产单位产品所耗工时随劳动生产率的提高而减少 E、某产品产量随工人劳动生产率的提高而增加 . . 10、设产品的单位成本(元)对产量(百件)的直线回归方程为 ,这表示(A、C、E )xyc85.176 A、产量每增加 100 件,单位成本平均下降 1.85 元 B、产量每减少 100 件,单位成本平均下降 1.85 元 C、
36、产量与单位成本按相反方向变动 D、产量与单位成本按相同方向变动 E、当产量为 200 件时,单位成本为 72.3 元 四、简答题 1、什么是抽样误差?影响抽样误差大小的因素有哪些? 答:抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指 标和拳击指标之间的绝对离差。影响抽样误差大小的因素主要有:(1)总体各单位标志值的差异程度。 (2)样 本的单位数。 (3)抽样方法。 (4)抽样调查的组织形式。 2、什么是抽样平均误差和抽样极限误差?二者有何关系? 答:抽样平均误差是反映误差一般水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标,而这既有 联系
37、又有区别。二者的联系是:极限误差是在抽样平均误差的基础上计算得到的,即 ;二者的区别是:z (1)二者的含义不同;(2)计算方法不同。 (答案在学习指导书 P343、第 4 题) 3、请写出计算相关系数的简要公式,说明相关关系的取值范围及其判断标准? 答:相关系数的简要公式: 2222 ynxnyr 1)相关系数的数值范围是在 1 和 +1 之间,即时 , 时为正相关, 时为负相关。0r0r 2)当 时, x 与 y 完全相关;两变量 是函数关系; 微弱相关 低度相关 当 时,x 与 y 不完全相关 (存在一定线性相关) 显著相关 高度相关 当 时,x 与 y 不相关 4、拟合回归程 yc=a
38、+bx 有什么前提条件? 在回归方程 yc=a+bx,参数 a,b 的经济含义是什么? 答:1)拟合回归方程 的要求有:1)两变量之间确存在线性相关关系;2)两变量相关的密切程 度必须是显著相关以上;3)找到全适的参数 a,b 使所确定的回归方程达到使实际的 y 值与对应的理论估计值 的离差平方和为最小。cy 2)a 的经济含义是代表直线的起点值,在数学上称为直线的纵轴截距,它表示 x=0 时 y 常项。 bxac3.5.0o1.8.10 10 . . 参数 b 称为回归系数,表示自变量增加一个单位时因变量 y 的平均增加值,回归系数 b 正负号可以判断相关 方向,当 b0 时,表示正相关,当
39、 b0 表示负相关。 六、计算题 1、 某企业生产一批零件,随机重复抽取 400 只做使用寿命试验。测试结果平均寿命为 5000 小时,样本标准差 为 300 小时,400 只中发现 10 只不合格。根据以上资料计算平均数的抽样平均误差和成数的抽样平均误差。 解:平均数的平均误差为 15403x 样本成数为 %.np21 成数的平均误差为 %8.74095_p)(x 2、外贸公司出口一种食品, 规定每包规格不低于 150 克,现在用重复抽样的方法抽取其中的 100 包进行检验, 其结果如下: 要求:(1)以 99.73%的概率估计这批食品平均每包重量的范围,以便确定平均重量是否达到规格要求;
40、(2)以同样的概率保证估计这批食品合格率范围。 解:2)已知: 3%;7.9)(;0ttFn 组中值 x 包数 f Xf 1485 10 1485 220522.5 1495 20 2990 447005 1505 50 7525 1132512.5 1515 20 3030 495045 合计 100 15030 2259085 每包重量(克) 包 数 148149 149150 150151 151152 10 20 50 20 100 fx2fxffx2 . . fxf (克) (克) 2)已知: 3%;7.9)(;70;1ttFn 答:1)以 99.73%的概率估计这批食品平均每包重量
41、的范围为 150.04-150.56 克,大于 150 克,所以平均重量是达 到规格要求 2) 以 99.73%的概率保证估计这批食品合格率范围为 56.26%-83.74。 3、单位按简单随机重复抽样方式抽取 40 名职工,对其业务情况进行考核,考核成绩资料如下: 68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87 要求:(1)根据上述资料按成绩分成以下几组:60 分以下,6070 分,7080 分,809
42、0 分,90100 分, 并根据分组整理成变量分配数列;(2)根据整理后的变量数列,以 95.45%的概率保证程度推断全体职工业务考 试成绩的区间范围;(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工? 解:1)分配数列 成绩 工人数(频数)f 各组企业数所占比重(频率)% 60 以下 3 75 6070 6 15 7080 15 375 8090 12 30 90100 4 10 合计 40 100 2)全体职工业务考试成绩的区间范围 30.15 872.03.15029822 x87.2.nx 67.3xt56.04.526.3.3.6Xxx f%58.410)7(.)(nP
43、pp4.1358.t7.%26.5 .3Ppp . . 52.1074262x 3)已知: (分) t = 267.12 32xx (人) 答:(2)根据整理后的变量数列,以 95.45%的概率保证程度推断全体职工业务考试成绩的区间范围 73.66- 80.3;(3)若其它条件不变,将允许误差范围缩小一半,应抽取 160 名职工 4、采用简单重复抽样的方法,抽取一批产品中的件作为样本,其中合格品为件。要求: ()计算样本的抽样平均误差 ()以的概率保证程度对该产品的合格品率进行区间估计() 解:已知:1) ;195;20n 2)已知 t=2 答: )样本的抽样平均误差为 1.1% ()以的概率
44、保证程度对该产品的合格品率区间为 95.3%-99.70% 成绩组中值 x 工人数 f xf 55 3 165 9075 65 6 390 25350 75 15 1125 84375 85 12 1020 86700 95 4 380 36100 合计 40 3080 241600 %1.20)597(.)(%.795 npnpp2.4pt7.93.5 5 PPp0.542xtn fx274038fx 52.104)(2fx67.14052.nx.1 xt 3.8.734.74 XXXfxff2 . . 5、某企业上半年产品产量与单位成本资料如下: 要求:()计算相关系数,说明两个变量相关的
45、密切程度。 ()配合回归方程,指出产量每增加件时,单位成本平均变动多少? 月份 产量(千件) 单位成本(元) 月份 产量(千件) 单位成本(元) 1 2 3 2 3 4 73 72 71 4 5 6 3 4 5 73 69 68 ()假定产量为件时,单位成本为多少元? 解:设产品产量为 x 与单位成本为 y 月份 产量(千件)x 单位成本(元/件) y 2x2yxy 1 2 73 4 5329 146 2 3 72 9 5184 216 3 4 71 16 5041 284 4 3 73 9 5329 219 5 4 69 16 4761 276 6 5 68 25 4624 340 合计 2
46、1 426 79 30268 1481 1)相关系数 2) 3) 时, (元) 答:()相关系数为 09091,说明两个变量相关的密切程度为高度负相关。 ()回归方程为 产量每增加件时,单位成本平均减少 1.8128 元 (3)假定产量为000 件时,单位成本为 66.46 元 2xxy2xxy2y901.4630817964)()( 22222 nny 34.76/21)8.(6/42.179/)(1 22 nxbyxabxyc812.347.6yc . . 6、根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下: (x 代表人均收入,y 代表销 售额) n=9 =546 =260 =34362 =16918xy2xxy 计算: (1)建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义; (2)若 2002 年人均收为 14000 元,试推算该年商品销售额 。 解:(1) 2) x=1400