1、 1 第四章 统计数据的概括性 度量 4 1 一家汽车零售店的 10 名销售人员 5 月份销售的汽车数量 (单位:台 )排序后如下: 2 4 7 10 10 10 12 12 14 15 要求: ( 1)计算汽车销售量的众数、中位数和平均数。 (2)根据定义公式计算四分位数。 (3)计算销售量的标准差。 (4)说明汽车销售量分布的特征。 解: Statistics 汽车销售数量 N Valid 10 Missing 0 Mean 9.60 Median 10.00 Mode 10 Std. Deviation 4.169 Percentiles 25 6.25 50 10.00 75 12.5
2、0 汽车销售数量1512.5107.552.5Frequency3210HistogramMean =9.6 Std. Dev. =4.169 N =104 2 随机抽取 25 个网络用户,得到他们的年龄数据如下: 单位:周岁 19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23 要求; (1)计算众数、中位数: 排序形成单变量分值的频数分布和累计频数分布: 网络用户的年龄 Frequency Percent Cumulative Frequency Cumulative Percent 2 Val
3、id 15 1 4.0 1 4.0 16 1 4.0 2 8.0 17 1 4.0 3 12.0 18 1 4.0 4 16.0 19 3 12.0 7 28.0 20 2 8.0 9 36.0 21 1 4.0 10 40.0 22 2 8.0 12 48.0 23 3 12.0 15 60.0 24 2 8.0 17 68.0 25 1 4.0 18 72.0 27 1 4.0 19 76.0 29 1 4.0 20 80.0 30 1 4.0 21 84.0 31 1 4.0 22 88.0 34 1 4.0 23 92.0 38 1 4.0 24 96.0 41 1 4.0 25 10
4、0.0 Total 25 100.0 从频数看出,众数 Mo 有两个: 19、 23;从累计频数看,中位数 Me=23。 (2)根据定义公式计算四分位数。 Q1 位置 =25/4=6.25,因此 Q1=19, Q3 位置 =3 25/4=18.75,因此 Q3=27,或者,由于 25 和 27 都只有一个,因此 Q3 也可等于 25+0.75 2=26.5。 (3)计算平均数和标准差; Mean=24.00; Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080; Kurtosis=0.773 (5)对网民年龄的分布特征进行综合分析: 分布,均
5、值 =24、标准差 =6.652、呈右偏分布。如需看清楚分布 形态,需要进行分组。 为分组情况下的直方图: 网络用户的年龄413834313029272524232221201918171615Count3210为分组情况下的概率密度曲线: 3 网络用户的年龄413834313029272524232221201918171615Count3.02.52.01.51.0分组: 1、确定组数: l g 2 5l g ( ) 1 . 3 9 81 1 1 5 . 6 4l g ( 2 ) l g 2 0 . 3 0 1 0 3nK ,取 k=6 2、确定组距: 组距 ( 最大值 - 最小值 ) 组
6、数 =( 41-15) 6=4.3,取 5 3、分组频数表 网络用户的年龄 (Binned) Frequency Percent Cumulative Frequency Cumulative Percent Valid 1, 则 k+1, k -1 若 2, 则 P(x=1)P(x= -1+2), k= -1+1= 是最大 综上 , 2 时 ,k=( 写成分段的形式 ,是取 整符号 ) 5.16 (1)0.6997 (2)0.5 5.17 173.913 5.18 (1)0.9332 (2)0.383 第六章 统计量及其抽样分布 6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为 盎司,通过
7、观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0 盎司的正态分布。随机抽取由这台机器灌装的 9 个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过 0.3 盎司的概率。 解:总体方差知道的情况下,均值的抽样分布服从 2,N n 的正态分布,由正态分布,标准化得到标准正态分布: z= xn 0,1N ,因此,样本均值不超过总体均值的概率 P 为: 0.3Px = 0.3xP nn = 0 .3 0 .31 9 1 9xP n = 0.9 0.9Pz =2 0.9 -1,查标准正态分布表得 0.9 =0.8159 10 因此, 0.3Px =0.6318 6.2 0.3
8、PY = 0 .3YPnn = 0.3 0.311xP n n n= | | 0.3P z n = 2 0.3 1n =0.95 查表得: 0.3 1.96n 因此 n=43 6.3 1Z , 2Z , 6Z 表示从标准正态总体中随机抽取的容量, n=6 的一个样本,试确定常数 b,使得 6 21 0.95iiP Z b 解:由于卡方分布是由标准正态分布的平方和构成的: 设 Z1, Z2, , Zn 是来自总体 N(0,1)的样本,则统计量 2 2 2 212 nZ Z Z 服从自由度为 n 的 2 分布,记为 2 2( n) 因此,令 6221 ii Z ,则 62 2 21 6ii Z,那
9、么由概率 6 21 0.95iiP Z b ,可知: b= 21 0.95 6 ,查概率表得: b=12.59 6.4 在习题 6.1 中,假定装瓶机对瓶子的灌装量服从方差 2 1 的标准正态分布。假定我们计划随机抽取 10 个瓶子组成样本,观测每个瓶子的灌装量,得到 10 个观测值,用这 10 个观测值我们可以求出样本方差 2 2 211( ( ) )1 n iiS S Y Yn ,确定一个合适的范围使得有较大的概率保证 S2 落入其中是有用的,试求 b1, b2, 使得 212( ) 0.90p b S b 解:更加样本方差的抽样分布知识可知,样本统计量: 2 22( 1) ( 1)ns
10、n 此处, n=10, 2 1 ,所以统计量 22 222( 1 ) (1 0 1 ) 9 ( 1 )1n s s sn 根据卡方分布的可知: 221 2 1 29 9 9 0 .9 0P b S b P b S b 又因为: 2 2 21 2 21 9 1 1P n S n 因此: 2 2 2 21 2 1 2 29 9 9 1 9 1 1 0 .9 0P b S b P n S n 2 2 2 21 2 1 2 29 9 9 1 9 1P b S b P n S n 2 2 20 . 9 5 0 . 0 59 9 9 0 .9 0PS 则: 221 0 .9 5 2 0 .0 59 9 , 9 9bb 220 .9 5 0 .0 51299,bb 查概率表: 20.95 9 =3.325, 20.05 9 =19.919,则 20.951 99b =0.369, 20.052 99b =1.88
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。