1、1第七章 参数估计7.1 (1) =0.7906xn540(2) = =1.54952xz1.967.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期 3 周的时间里选取 49 名顾客组成了一个简单随机样本。(1)假定总体标准差为 15 元,求样本均值的抽样标准误差。 =2.143xn1549(2)在 95的置信水平下,求估计误差。,由于是大样本抽样,因此样本均值服从正态分布,因此概率度 t=xxt 2z因此, =1.962.143=4.22xz0.25x(3)如果样本均值为 120 元,求总体均值 的 95的置信区间。置信区间为: = =(115.8,124.2)22,xn14.2,0
2、.7.3 = =(87818.856,121301.144)2,zz85046.97.4 从总体中抽取一个 n=100 的简单随机样本,得到 =81,s=12。x要求:大样本,样本均值服从正态分布: 或2,xNn:2,sn:置信区间为: , = =1.222,ssxzzn 10(1)构建 的 90的置信区间。= =1.645,置信区间为: =(79.03,82.97)2z0.581.645.,8.645.2(2)构建 的 95的置信区间。= =1.96,置信区间为: =(78.65,83.35). .92,1.9(3)构建 的 99的置信区间。= =2.576,置信区间为: =(77.91,8
3、4.09)2z0.58.576.,8.576.27.5 (1) = =(24.114,25.886)2xzn351.90(2) = =(113.184,126.016)s 2.675(3) = =(3.136,3.702)2xzn .43.419.37.6 (1) = =(8646.965,9153.035) 08.65(2) = =(8734.35,9065.65)2xzn91.3(3) = =(8761.395,9038.605)s 08.6452(4) = =(8681.95,9118.05)2sxzn50892.37.7 某大学为了解学生每天上网的时间,在全校 7 500 名学生中采取
4、重复抽样方法随机抽取 36 人,调查他们每天上网的时间,得到下面的数据(单位:小时) :3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.24.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.32.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.54.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5求该校大学生平均上网时间的置信区间,置信水平分别为 90,95和 99。解:(1)样本均值 =3.32,样本标准差 s=1.61x=0.9,t= = =1.645, = =(2.88,3.76)2z0.52sxzn1.63.453=
5、0.95,t= = =1.96, = =(2.79,3.85). .9=0.99,t= = =2.576, = =(2.63,4.01)12z0.52sxzn1.6.2737.8 = =(7.104,12.896)2sxtn34687.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由 16 个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的 95的置信区间。解:小样本,总体方差未知,用 t 统计量 xtsn1t:均值=9.375,样本标准差 s
6、=4.11, =0.95,n=16, = =2.1312t0.25t置信区间: 22,sxtnxt = =(7.18,11.57)4.4.9.3751,93756167.10 (1) = =(148.8695,150.1305)2sxzn .93.(2)中心极限定理711 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为 l00g。现从某天生产的一批产品中按重复抽样随机抽取 50 包进行检查,测得每包重量 (单位:g) 如下:每包重量(g) 包数969898100100102102104104106233474合计 50已知食品包重量服从正态分布,要求: (1)确定该种食品平均重量的 9
7、5的置信区间。 解:大样本,总体方差未知,用 z 统计量: xzsn0,1N:3样本均值=101.4,样本标准差 s=1.829, =0.95, = =1.9612z0.5置信区间: 22,ssxzxzn= =(100.89,101.91)1.89.8910.46,0.46550(2)如果规定食品重量低于 l00g 属于不合格,确定该批食品合格率的 95的置信区间。解:总体比率的估计。大样本,总体方差未知,用 z 统计量: 1pzn0,1N:样本比率=(50-5)/50=0.9 , =0.95, = =1.96120.5置信区间: 2 1,ppzznn = =(0.8168,0.9832)0.
8、91.0.9.6,.655 7.12 正态分布,大样本,方差未知= =(15.679,16.576)2sxzn 0.871.2.5713 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了 18 个员工。得到他们每周加班的时间数据如下(单位:小时) :63218171220117902182516152916假定员工每周加班的时间服从正态分布。估计网络公司员工平均每周加班时间的 90%的置信区间。解:小样本,总体方差未知,用 t 统计量: xtsn1t:均值=13.56,样本标准差 s=7.801, =0.90,n=18, = =1.736912t0.57t置信区间: 2
9、21,ssxtnxtn = =(10.36,16.75)7.807.8013.569,3.56197.14 (1) = =(0.33159,0.7041)2pzn .5.24(2) = =(0.7765,0.8635)1 0.81.20.8963(3) = =(0.4558,0.5042)2pzn .45715 在一项家电市场调查中随机抽取了 200 个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占 23。求总体比例的置信区间,置信水平分别为 90%和 95%。解:总体比率的估计4大样本,总体方差未知,用 z 统计量: 1pzn0,1N:样本比率=0.23, =0.90
10、, = =1.645120.5置信区间: 22,ppzzn = =(0.1811,0.2789)0.31. 0.31.20.231645,031.645 =0.95, = =1.962z0.52,ppznn = =(0.1717,0.2883)0.31.0.231.0.23196,031.96 7.16 = =1662()zsnE2.5767.17 (1) = =25222(1)2.04(1.)(2) = =601 (当 未知是,取 0.5)2)zn2.965.(3) = =328(1)E.40(1.).7.18 (1) = =(0.5070,0.7731)2pzn .640.695(2) =
11、 =62()1)n208(1.)7.19720 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取 10 名顾客,他们在办理业务时所等待的时间(单位:分钟) 如下:方式 1 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7方式 2 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9
12、.3 10要求:(1)构建第一种排队方式等待时间标准差的 95的置信区间。解:估计统计量: 21nSn经计算得样本标准差 =3.318, =0.95,n=10 ,2s= =19.02, = =2.7210.592120.9755置信区间: = =(0.1075,0.7574)22211nSnS90.72.,1因此,标准差的置信区间为(0.3279,0.8703)(2)构建第二种排队方式等待时间标准差的 95的置信区间。解:估计统计量: 2nSn经计算得样本标准差 =0.2272, =0.95,n=10 ,1s= =19.02, = =2.7220.592120.975置信区间: = =(1.5
13、7,11.06)221nSnS318.,.因此,标准差的置信区间为(1.25,3.33)(3)根据(1)和(2) 的结果,你认为哪种排队方式更好?第一种方式好,标准差小。7.21 正态总体,独立小样本,方差未知但相等:(其中 , )2121()psxtn2221()(1)pnsss12()dfn:(1) = =1.7291,代入略20.547t(2) = =2.0930,代入略21t.2(3) = =2.8609,代入略20.51t7.22 (1)正态或非正态总体,独立大样本,方差未知 212()sxZn(2)正态总体,独立小样本,方差未知但 :12(其中 , )2121()psxt2212(
14、)()pnsss12()dfn:(3)正态总体,独立小样本,方差未知 但 ,22112()stn(4)正态总体,独立小样本,方差未知但 , :1212n(其中 , )2121()psxt212()()pnsss12()dfn:(5)正态总体,独立小样本,方差未知但 ,12(其中 )2112()sxtn122()sndf723 下表是由 4 对观察值组成的随机样本。配对号 来自总体 A 的样本 来自总体 B 的样本123251007664 8 5(1)计算 A 与 B 各对观察值之差,再利用得出的差值计算 和 。ds=1.75, =2.62996dds(2)设 分别为总体 A 和总体 B 的均值
15、,构造 的 95的置信区间。12和 12d解:小样本,配对样本,总体方差未知,用 t 统计量ddtsn1t:均值=1.75,样本标准差 s=2.62996, =0.95,n=4, = =3.182121tn0.253t置信区间: 22,ddssttn = =(-2.43,5.93).69.691.7538,.7538447.24 小样本,配对样本,总体方差未知: = =2.262221tn0.251t= =(6.3272,15.6728)21dsdtn6.2.0725 从两个总体中各抽取一个 250 的独立随机样本,来自总体 1 的样本比例为 40,12n 1p来自总体 2 的样本比例为 30
16、。要求:2p(1)构造 的 90的置信区间。1(2)构造 的 95的置信区间。2解:总体比率差的估计大样本,总体方差未知,用 z 统计量: 121212pzpn0,1N:样本比率 p1=0.4,p2=0.3 ,置信区间: 12 1212 12 1,pppppz znn =0.90, = =1.64520.512 1212 12,zpz = 0.4.03.0.4.031.0.65,.655 5 =(3.02%,16.98%)=0.95, = =1.9612z0.512 122 12 1,ppppp znn = 0.4.03.0.4.03.196,.95555 7=(1.68%,18.32%)7.
17、26 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对序进行改进以减小方差。下面是两部机器生产的袋茶重量(单位:g) 的数据:机器 1 机器 23.45 3.22 3.9 3.22 3.28 3.353.2 2.98 3.7 3.38 3.19 3.33.22 3.75 3.28 3.3 3.2 3.053.5 3.38 3.35 3.3 3.29 3.332.95 3.45 3.2 3.34 3.35 3.273.16 3.48 3.12 3.28 3.16 3.283.2 3.18 3.25 3.3 3.34 3.25要求:构造两个总体方差比 / 的 95的置信区间。21解:统
18、计量:212s12,Fn:置信区间: 1122,ssnn =0.058, =0.006,n1=n2=21, =0.95, = =2.4645,21s2s 212,Fn0.25,F=,1F21,Fn= = =0.4058122,n0.9750.25,=(4.05,24.6)212122,ssFFn 727 根据以往的生产数据,某种产品的废品率为 2。如果要求 95的置信区间,若要求估计误差(边际误差)不超过 4,应抽取多大的样本 ?解: , , =0.95, = =1.9621pzn21pz2z0.5= =47.06,取 n=48 或者 50。2pn2.960.984728 某超市想要估计每个顾
19、客平均每次购物花费的金额。根据过去的经验,标准差大约为 120 元,现要求以 95的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过 20 元,应抽取多少个顾客作为样本?解: , =0.95, = =1.96,2xzn12z0.5=138.3,取 n=139 或者 140,或者 150。2x2.9608第八章 假设检验8.1 提出假设:H 0: =4.55;H 1: 4.55构建统计量(正态,小样本,方差已知): = =-1.830xzn4.8.519求临界值: =0.05, = =1.962z0.5决策:因为 ,所有,不拒绝 H0结论:可以认为现在生产的铁水平均含碳量是 4.
20、5582 一种元件,要求其使用寿命不得低于 700 小时。现从一批这种元件中随机抽取 36 件,测得其平均寿命为 680 小时。已知该元件寿命服从正态分布, 60 小时,试在显著性水平 005 下确定这批元件是否合格。解:提出假设:H 0: 700;H 1:700构建统计量(正态, 大样本,方差已知): -20xzn6873求临界值:当 0.05,查表得 1.645。z决策:因为 z- ,故拒绝原假设,接受备择假设结论:说明这批产品不合格。8.3 提出假设:H 0:H 0:250;H 1:250构建统计量(正态,小样本,方差已知): = =3.330xzn2753求临界值: =0.05, =
21、=1.645z0.5决策:因为 ,所有,拒绝 H02结论:明显增产84 糖厂用自动打包机打包,每包标准重量是 100 千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得 9 包重量 (单位:千克) 如下:993 987 1005 1012 983 997 995 1021 1005已知包重服从正态分布,试检验该日打包机工作是否正常(a0.05)?解:提出假设:H 0: 100;H 1:100构建统计量(正态, 小样本,方差未知): -0.0550xtsn9.7802求临界值:当 0.05,自由度 n18 时,查表得 2.306。2决策:因为 ,样本统计量落在接受区域,故接受原假设,
22、拒绝备择假设t2结论:说明打包机工作正常。85 某种大量生产的袋装食品,按规定不得少于 250 克。今从一批该食品中任意抽取 50 袋,发现有6 袋低于 250 克。若规定不符合标准的比例超过 5就不得出厂,问该批食品能否出厂 (a005)?解:提出假设: H0:0.05;H 1: 0.05构建统计量: 2.2710pZn.120.5求临界值:当 0.05,查表得 1.645。z决策:因为 ,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设z结论:说明该批食品不能出厂。8.6 提出假设:H 0: 25000;H 1:250009构建统计量(正态,小样本,方差已知): 1.5490xtsn27
23、501求临界值:当 0.05,查表得 1.645。z决策:因为 z ,故不能拒绝原假设结论:没有充分证据证明该厂家的广告是真实的87 某种电子元件的寿命 x(单位:小时) 服从正态分布。现测得 16 只元件的寿命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命显著地大于 225 小时(a005)?解:提出假设:H 0: 225;H 1:225构建统计量(正态,小样本,方差已知): 0.669xtsn241.59876求临界值:当 0.05,自由度 n115 时,查表得 1.753t决
24、策:因为 t ,样本统计量落在接受区域,故接受原假设,拒绝备择假设结论:说明元件寿命没有显著大于 225 小时。8.88.9810 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取 12 件产品,记录各自的装配时间(单位:分钟) 如下:甲方法:31 34 29 32 35 38 34 30 29 32 31 26乙方法:26 24 28 29 30 29 32 26 31 29 32 28两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同 (a005)?解:提出假设:H 0: 1 2=0;H 1: 1
25、20构建统计量(总体正态,小样本抽样,方差未知,方差相等): 12pxtsn根据样本数据计算,得 12, =12, 31.75, 3.19446, 28.6667, =2.46183。1n21x1s22s 8.1326212psss20.960.762.64821pxtsn求临界值:0.05 时,临界点为 2.07421tn0.25t决策:此题中 ,故拒绝原假设t2结论:认为两种方法的装配时间有显著差异811 调查了 339 名 50 岁以上的人,其中 205 名吸烟者中有 43 个患慢性气管炎,在 134 名不吸烟者中有 13 人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎 ”这种
26、观点(a005)?解:提出假设:H 0: 1 2;H 1: 1 2p143/205=0.2097 n1=205 p213/134=0.097 n2=13410构建统计量: 31221pdzpn0.298.70.11.954求临界值:当 0.05,查表得 1.645z决策:因为 ,拒绝原假设z结论:说明吸烟者容易患慢性气管炎812 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过 60 万元。随着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样项目条件下,贷款的平均规模是否明显地超过 60 万元,故一个 n=144 的随机样本被抽出,测得 =681 万元,s=45。用 a
27、001 的显著性水x平,采用 p 值进行检验。解:提出假设:H 0: 60;H 1:60构建统计量(大样本,方差未知): 2.160zsn68.45求临界值:由于 ,因此 P 值=P(z2.16)=1- ,查表的 =0.9846,P 值x2.12.16=0.0154决策:由于 P0.01,故不能拒绝原假设结论:说明贷款的平均规模没有明显地超过 60 万元。813 有一种理论认为服用阿司匹林有助于减少心脏病的发生,为了进行验证,研究人员把自愿参与实验的 22 000 人随机平均分成两组,一组人员每星期服用三次阿司匹林 (样本 1),另一组人员在相同的时间服用安慰剂(样本 2)持续 3 年之后进行
28、检测,样本 1 中有 104 人患心脏病,样本 2 中有 189 人患心脏病。以 a005 的显著性水平检验服用阿司匹林是否可以降低心脏病发生率。解:提出假设:H 0: 1 2;H 1: 1 2p1104/11000=0.00945 n1=11000 p2189/11000=0.01718 n2=11000构建统计量: 12pdzn -50.945.1780. .1781求临界值:当 0.05,查表得 1.645z决策:因为 - ,拒绝原假设z结论:说明用阿司匹林可以降低心脏病发生率。8.14 815 有人说在大学中男生的学习成绩比女生的学习成绩好。现从一个学校中随机抽取了 25 名男生和 16 名女生,对他们进行了同样题目的测试。测试结果表明,男生的平均成绩为 82 分,方差为 56 分,女生的平均成绩为 78 分,方差为 49 分。假设显著性水平 =002,从上述数据中能得到什么结论?解:方差比检验:提出假设:H 0: ;H 1: 212(已知:n1=25, =56,n2=16, =49)ss构建统计量: 1.14321F5649求临界值:当 0.02 时, 3.294, 0.346。2,1124,5F决策:由于 F ,检验统计量的值落在接受域中,所以接受原假设12,45结论:说明总体方差无显著差异。