非参数统计学讲义(第六章)讲稿2.doc

上传人:hw****26 文档编号:2310184 上传时间:2019-05-05 格式:DOC 页数:8 大小:396KB
下载 相关 举报
非参数统计学讲义(第六章)讲稿2.doc_第1页
第1页 / 共8页
非参数统计学讲义(第六章)讲稿2.doc_第2页
第2页 / 共8页
非参数统计学讲义(第六章)讲稿2.doc_第3页
第3页 / 共8页
非参数统计学讲义(第六章)讲稿2.doc_第4页
第4页 / 共8页
非参数统计学讲义(第六章)讲稿2.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、第 页 1非参数统计学讲义第六章 分布检验和某些卡方检验1 引 言本章属于拟合优度检验问题,即模型检验或分布的检验,属于非参数检验的范畴。在初等统计中,人们要想知道数据是否服从某一特定分布,可以通过直方图,或 P-P 图,Q-Q 图来直接判断,但这种直观的方式很不精确。本章将介绍几种分布的检验:K-S 检验,Lilliefors 检验和 检验。2实际上,K-S 检验是在针对 检验的缺点 1上提出的。它们是建立在经验分布函数基础上的检验结果。22 Kolmogorov 检验一、基本假设一般地要检验手中的样本是否来自某个已知 ,假定其真实分布为 ,对应的检验类型有0()Fx()Fx对 至少有一个

2、x00:()AHFx10:()H对 至少有一个 xB 对 至少有一个 xC 设 为该组数据的经验分布函数,则()S()ii IXxXxnn的 数 目二、基本方法Kolmogorov 于三十年代提出了一种基于经验分布的检验方法,基本思想是:由格里文科定理,当 时,样本经验分布n以概率 1 一致收敛到总体分布 F,为此可以定义 到 的距离为nF()Sx0F00(),sup()DSxSx当 H0 成立时,由格氏定理,D 以概率 1 收敛到 0,因此 D 的大小可以度量 对总体分布拟合的好坏。0()Fx可供选择的检验统计量分别为;类型 A 0()x类型 B ()sFSx类型 C 0(upx在实际操作时

3、,如果有 n 个观察值,用下面的统计量代替上面的 D0101max(),()(niiiiiDSSxNOTE:由 的取值是离散的,考虑到跳跃性,该 能够保证 S 与 F0 之间取得最大距离;n 在 H0 下的分布有表可查,P201n在大样本时,有近似分布 ,这里的分布函数 有表达式,P122,该分布有表可查 P203:()(nPDdK()Kd三、应用举例【例 6-1】轴承的内径检验检验某车间生产的 20 个轴承外座圈的内径,测得数据如下(单位:mm)表 6-1 轴承内径数据15.04 15.36 14.57 14.53 15.57 14.69 15.37 14.66 14.52 15.4115.

4、34 14.28 15.01 14.76 14.38 15.87 13.66 14.97 15.29 14.95按照设计要求,这个内径应在 150.2mm,检验是否符合标准,即检验该数据是否来自均值 ,方差 的正态1520.1 检验与 K-S 检验均属拟合优度检验,但 检验常用于定类尺度测量数据,K-S 检验还用于定序尺度测量数据;当预期频数22较小时, 检验常需要合并邻近的类别才能计算,K-S 检验则不需要,因此它能比 检验保留更多的信息;对于特别小的样本2数目, 检验不能应用,而 K-S 检验则不受限制。第 页 2分布。分析:方法一,可以利用直方图、Q-Q 图、P-P 图进行直观判断;Hi

5、stogram (6-1.sta v*20c)Var1 =20*.nlx,495, .16)13.4.613.84.01.24.1.64.815.0.215.4.615.86.01.2Var012345No fbsVar: SW- =09753, p=839; N= 2,Men =49, StdDv =0295,Mx58,Min 6;D50p s.,Lilfors-pQuantile-til Potf Var1(6-.sta 1v*20c)Dsrbuin:NmlV1 =4.95+0.327*x-2.5-.0-1.5-.0-.50.51.0.52.0.5Theortical Quntile0.1

6、0.5.10.2.50.9.50.9134.6814.02.146.8501.245.68Observd Value方法二,利用 Kolmogorov 检验由 P122 表中数据得: ,拒绝 H0,认为不满足要求。2 0.23近似 ,P-值=0.9790.05,接受 H0。.【例 6-2】 数理统计与管理论文作者服从洛特卡分布 2将 46 期的数理统计与管理的文章按第一作者统计,得到表 7-2 的结果。论文作者数是否服从洛特卡分布。表 6-2 论文数目与作者数的统计表论文数(x) 1 2 3 4 5 6 7作者(y) 343 27 9 1 1 1 2分析:洛特卡得出这样的一个关系:若以 x 表

7、示每一作者所著的论文数,与其相应的写 x 篇论文的作者数为 y,则 y 与 x 成反比关系。即有* MERGEFORMAT (0.1)myNCA式中,N 为论文总数,m、C 为两个特定的常数,在不同的学科领域数值不同。假定根据表 62 提供的数据,认为论文作者服从洛特卡分布,并对其真实性进行检验,首先必须确定它的理论分布,即计算出 m、C 的值。估计 m 的值,通常采用最小二乘法。将( 6.1)式进行对数变换,使其线性化,得到:* MERGEFORMAT (0.2)lnlnyxm 相当于一元线性回归方程 中的回归系数 b,根据表中的数据运用最小二乘法,得到 m=3.0550。关于 C 值,可以

8、Yabx用这样一个公式进行近似计算。这是 1985 年美国情报学家 M.L.Pao 教授在数学家的协助之下提出的。计算式为:19 11/(29)/()9/(249)mmmx AAA经计算, 。因此 46 期数理统计与管理的论文与作者/.08.60.08.39CA数的理论洛特卡分布为* MERGEFORMAT (0.3)3.5().89/fyx为了判定数理统计与管理论文作者的实际分布是否与理论分布一致,可以采用 Kolmogorov 检验。建立的假设组为对00:()nHSxFx至少有一个 x1理论累积频率 的各个值,可以将 x 分别代入(6.3)式计算得到,实际累积频率是将累计的作者数 分别除以

9、作者y2 洛特卡定律是 1926 年 6 月 19 日洛特卡(Vlachy)在美国颇有影响的学术刊物华盛顿科学院杂志上首先提出,它第一次提示了作者与文献量的统计规律性。在这之后,洛特卡进一步发展了洛特卡定律,得出这样的一个关系:若以 x 表示每一作者所著的论文数,与其相应的写 x 篇论文的作者数为 y,则 y 与 x 成反比关系。第 页 3总人数得到。计算结果,作者实际累积频率及理论累积频率及各个差值如表 6-3。表 6-3 作者实际累积频率与理论累积频率表x1 2 3 4 5 6 70()F0.8389 0.9398 0.9690 0.9811 0.9872 0.9907 0.9929nS0

10、.8932 0.9635 0.9870 0.9896 0.9922 0.9948 1.00000x0.0543 0.0237 0.0180 0.0085 0.0050 0.0041 0.00710ma().543nDx根据显著性水平 ,作者人数 ,查表,由于 ,得临界值.18ny45n。显然1.63/384.2dA05.d因此数据在 1%的显著性水平上不能拒绝 H0,若显著性水平 ,查表得临界值0.。显然././.69n430.4D因此,数据在 5%的显著性水平上也不能拒绝 H0,可以认为, 数理统计与管理作者的分布服从洛特卡分布。第 页 43 Lilliefors 正态性检验Lilliefo

11、rs 正态性检验实质上是对 Kolmogorov 检验的一个改进。当用 Kolmogorov 检验某样本是否来自一正态总体时,当 和 未知时,就会用样本均值 作为总体均值 的估计,样本方差 作为总体方差 的估计,从而将数2(,)N2 X2S2据 标准化为: ,再用标准正态分布 作 来计算 K 氏统计量 。iXiXZ()x0FnD但这时统计量 在 H0 下的分布发生了改变,Lilliefors(1976)对 Kolmogorov 的检验临界值表作了修正。nD第 页 54 Smirnov 两样本检验一、 Smirnov检验主要用来检验两个样本是否同时来自于某一总体,设样本 来自 分布,而样本 来自

12、分布为12,mX ()Fx12,nY的总体。Smirnov 检验的基本思想和 Kolmogorov 检验一样,因此经常通称这两个检验为 Kolmogorov-Smirnov 拟合优度检验,()Gy简称 K-S 检验。1基本假设检验类型为:类型 A 对 至少有一个 x0:()HFxGx1:()HxG类型 B 对 至少有一个 xF类型 C 对 至少有一个 x2基本方法设 和 分别为这两个样本的经验分布函数。()mxny则检验 A 的统计量可以取* MERGEFORMAT (0.4)ax(),max()()Nmini jnji jDFGFyG式中 NOTE:含义其它检验类型的统计量仿此可以写出 的分

13、布有表可查,P204,P205N大样本时,有近似分布 ()NnPDdKm二、 应用举例【例 6-4】检验两个地区的 GDP 指数是否具有相同的分布华北五省市区和华东七省市 1996 年的 GDP 指数(前一年为 100)数据如下:表 6-4 两个地区的 GDP 指数华北 109.2 114.3 113.5 111.0 112.7华东 113.0 112.2 112.7 114.4 115.4 113.4 112.2检验这两个地区的 GDP 指数的分布是否相同。分析:数据的计算过程详见 P1260.22/50.471NDd接受 H0。5 2 拟合优度检验检验目的:检验样本是否来自于某一特定的分布

14、或总体。在 20 世纪初,Pearson 提出了拟合优度的 统计量。其基本做法是:首先将样本区间进行分割,抽取 n 个观察值(相当于做2了 n 次试验) ,则 X 落在每个区间中的数目服从多项分布,我们就是让这个多项分布去逼近 X 的分布* MERGEFORMAT (0.5)22211()(1)kkiiiinpnQkr其中:r 为总体分布里待估参数的个数, k 为划分的组数。卡方拟合优度检验就是用来检验一批分类数据所来自的总体分布是否与某种理论分布相一致,即检验 。00)(:FxH其基本思想是:设总体可以分成 类,现对总体作了 n 次观察,各类出现的频数分别为 ,且 ,则在kn,21 ni1成

15、立时,应有实际频数 与理论频数 相差不大。为此,在 20 世纪初,Pearson 提出了拟合优度的 统计量。0Hinip 2* MERGEFORMAT (0.6)1(1)( 2212knQkikii 第 页 6第 页 76 二维列联表的齐性和独立性的 检验2统计量特别适合于分类数据的各种模型的检验。因为在分类数据的场合不存在假设分布与由对总体支撑集的划分所导出分2布的区别。虽然 检验统计量的形式一样,但对不同的目的和不同的数据结构的解释是不一样的。2一、列联表的齐性检验实际问题中,常遇到:有 n 组从不同来源得到的数据,要判定这些数据的来源是否相同 3(有相同的分布) ,统计上我们可以将这些问

16、题表述为:假定有组样本,分别取自 k 个总体,要检验这 k 个总体的分布是否相同。这样的假设检验问题称为“齐次性检验” 。对一般的二维列联表 P130,可以提出假设01:(1,2)iicHPr 不全相等在 H0 下,这些概率 与 j 无关,因此 的期望值(理论频数)为 , ,因此期望值i ijnjinP/iin,则 检验统计量为/ijjiijenn2* MERGEFORMAT (0.7)22(1)()ijijijrcijeQ二、列联表的独立性检验关心的目标是两个变量是否相互影响(独立) 0:ijijHP至少有一个不相等1* MERGEFORMAT (0.8)222(1)()ijijijrcij

17、nenQ式中, ijijijijenPNOTE:对立联表的齐次性检验和独立性检验,虽然检验的统计量均为 统计量且有相同的分布形式。但两者之间有一些实2质性区别独立性检验中的数据是取自一个总体的二维样本,而齐次性检验中的数据是取自多个总体的一维样本;独立性检验是要检验两个变量的独立性,而齐次性检验则是要检验多个总体分布的齐次性;在独立性检验中 是随机变量,而齐次性检验中的 不是随机变量;in in独立性检验中的 统计量的极限分布只要在 时,就成立,而齐次性检验中的 统计量的极限分布要在22都趋于无穷时才成立。12,kn三、应用举例【例 6-7】人们去三个商场的概率是否一样在一个有三个主要百货商场

18、的商贸中心,调查者问 479 个不同年龄段的人首先去三个商场中的哪个,结果如下表表 6-6 调查结果年龄段 商场 1 商场 2 商场 3 总和30 83 70 45 1983150 91 86 15 19250 41 38 10 89总和 215 194 70 479问:人们去这三个商场的概率是否一样。分析:列联表的齐次性检验 013:(1,2)iiHP不全相等3 如:有来自不同地区的地质样品,通过这些样品来了解这些地区的地质结构是否相同。第 页 822222 20.5()8370108.651.43()195/41984/897/4ijijijijnenQ 拒绝 H0。【例 6-8】在丧偶问

19、题上的性别因素和地区因素是否独立按照 1996 年一个抽样,我国华北五省市区的丧偶人数按性别分为表 6-7 1996 年华北地区丧偶情况统计男 女 合 计北 京 112 356 478天 津 130 305 435河 北 846 1787 2633山 西 359 782 1141内蒙古 291 558 849合 计 1748 3788 5536问:在丧偶数量上性别因素和地区因素是否独立。分析:该问题属于独立性检验 0:ijijHP至少有一个不相等12 20.51.39.4()ijijnQ拒绝 H0。【本章思考题】1 Kolmogorov 检验和 Smirnov 检验是怎样计算的?2 列联表齐次性的检验和独立性检验所使用的 统计量有什么不同?2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 精品笔记

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。