1、抽样方法、正态分布重点、难点讲解: 1抽样的三种方法: 简单随机抽样、系统抽样、分层抽样。后两种方法是建立在第一种方法基础上的。2了解如何用样本估计总体: 用样本估计总体的主要方法是用样本的频率分布来估计总体分布,主要有总体中的个 体取不同数值很少和较多甚至无限两种情况。 3正态曲线及其性质 正态分布常记作 N( ) ,其正态分布函数:f(x)= , x(-,+) 。 把 N(0,1)称为标准正态分布,相应的函数表达式:f(x)= , x(-,+) 。 正态图象的性质: 曲线在 x 轴的上方,与 x 轴不相交。 曲线关于直线 x= 对称。 曲线在 x= 时位于最高点。 当 x 时,曲线下降,并
2、且当曲线向左、右两边无限延伸时, 以 x 轴为渐近线,向它无限靠近。 当 一定时,曲线的形状由 确定, 越大,曲线越“矮胖”,表示总体的分布越分 散; 越小,曲线越“ 瘦高” ,表示总体的分布越集中。 4一般正态分布与标准正态分布的转化 对于标准正态分布,用 表示总体取值小于 x 0 的概率,即 =p(xx 0 ),其几 何意义是由正态曲线 N(0,1),x 轴,直线 x=x 0 所围成的面积。又根据 N(0,1) 曲线关于 y 轴的对称性知, ,并且标准正态总体在任一区间(a,b)内取值概率 。 任一正态总体 N() ,其取值小于 x 的概率 F(x)= 。 5了解“小概率事件” 和假设检验
3、的思想。 知识应用举例: 例1为了了解某大学一年级新生英语学习的情况,从503名大学一年级学生中抽取50 名作为样本,如何采用系统抽样方法完成这一抽样? 思路分析:因为总体的个数503,样本的容量50,不能整除,故可采用随机抽样的方法 从总体中剔除3个个体,使剩下的个体数500能被样本容量50整除,再用系统抽样方法。 解:第一步:将503名学生随机编号1,2,3,503 第二步:用抽签法或随机数表法,剔除3个个体,剩下500名学生,然后对这500名学生 重新编号。 第三步:确定分段间隔 k= =10,将总体分成50个部分,每部分包括10个个体,第一 部分的个体编号为1,2,10;第二部分的个体
4、编号11,12,20;依此类推, 第50部分的个体编号491,492,500。 第四步:在第一部分用简单随机抽样确定起始的个体编号,例如是7。 第五步:依次在第二部分,第三部分,第五十部分,取出号码为 17,27,497,这样就得到了一个容量为50的样本。 例2对某电子元件进行寿命追踪调查,情况如下: (1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在100h400h 以内的概率; (4)估计电子元件寿命在400h 以上的概率; (5)估计总体的数学期望。 思路分析:由于样本的取得具有代表性,因此,可以利用样本的期望近似地估计总体 的期望。 解:(1)样本频率分布表如
5、下: (2)频率分布直方图如下: (3)从频率分布表可知,寿命在100h400h 的元件出现的概率为0.65;(4)由频率分布表可知,寿命在400h 以上的电子元件出现的频率为0.20+0.15=0.35 , 故我们估计电子元件寿命在400h 以上的概率为0.35。 (5)样本的期望为: 所以,我们估计生产的电子元件寿命的总体期望值(总体均值)为365h。 例3正态总体为 =0, =1时的概率密度函数是 f(x)= , x(-, +) , (1)证明 f(x)是偶函数;(2)利用指数函数的性质说明 f(x) 的增减性。 证明:(1)任意的 xR,f(-x)= , f(x)是偶函数。 (2)任取
6、 x 1 x 2 0 ,则 , , ,即 f(x 1 )f(x 2 )。 这说明 f(x)在(-,0)上是递增函数, 同理可证 f(x)在(0, +)上是递减函数。 例4随机变量 服从 N(0,1),求下列值。 (1)P(2.55) (2)P(-1.44) (3)P(|1.52) 思路分析:标准正态分布,可以借助标准正态分布表。用到的公式主要有: (-x)=1- (x); P(axb)= (b)- (a);p(xx 0 )=1-p(xx 0 )。 解:(1)P(2.55)=1-p(2.55)=1- (2.55)=1-0.9946=0.0054。 (2)P(-1.44)= (-1.44)=1-(
7、1.44)=1-0.9251=0.0749。 (3)P(|1.52)=p(-1.521.52)= (1.52)- (-1.52) =2 (1.52)-1=20.9357-1=0.8714。 例5设 ,且总体密度曲线的函数表达式为:f(x) , x(- ,+)。 (1)求 , ;(2)求 p(|x-1| )及 p(1- x1+ )。 思路分析:对照正态曲线函数,可以得出 , ;利用一般正态总体 N( ) 与标准正 态总体 N(0,1)概率间的转化关系,可以求出(2) 。 解:(1)整理得:f(x)= ,所以,=1, ,故 。 (2)p(|x-1| )=p(1- x1+ )=F(1+ )-F(1-
8、 ) = ()- ( )= (1)- (-1)=2 (1)-1 =20.8413-1=0.6826。p(1- x1+2 )=F(1+2 )-F(1- ) = ( )- ( )= (2)- (-1)= (2)+ (1)-1 =0.9772+0.8413-1=0.8185。 例6某城市从南郊某地乘车前往北区火车站有两条路可走,第一条线路穿过市区,路 程较短,但交通拥挤,所需时间(单位:分钟)服从正态分布 N(50,100), 第二条线路沿环 城公路走,路程较长,但交通阻塞少,所需时间(单位:分钟)服从正态分布 N(60, 16) , (1)若只有70分钟时间可用,应走哪条路? (2)若只有65分钟时间可用,应走哪条路? 思路分析:所谓最佳线路(应选择的线路)就是在允许的时间内有较大概率赶到火车 站的那条线路。 解:设 x 为行车时间。 (1)走第一条路及时赶到的概率为: P(0x70)= = (2)=0.9772。 走第二条线路及时赶到的概率为: P(0x70)= ( )= (2.5)=0.9938 。 因此应走第二条线路。 (2)走第一条线路及时赶到的概率为: P(0x65) ( )= (1.5)=0.9332 。 走第二条线路及时赶到的概率为: P(0x65) ( )= (1.25)=0.8944 。 因此应走第一条线路。