1、两种假设检验思想的比较 关键字: 检验思想 【提 要】 目的 探讨经典统计学派与贝叶斯学派假设检验思想的异同。方法 总结和概括两种思想,并结合一个实例对两种思想进行比较。结果 两种思想统一于贝叶斯定理,并在特定场合下相互等价;贝叶斯方法在先验信息的利用、风险的回答、损失的考虑以及多重假设问题的处理等方面较经典方法具有明显的优势。结论 贝叶斯学派的理论应用受到重视。 【Abstract】 Objective To discuss differences between classical and Bayesian testing thoughts.Methods First these two
2、thoughts are summarizedand then they are compared through an example.Results It is pointed out that these two thoughts are united on Bayess Theoremthat they are equal on given occasionsand that Bayesian testing approaches have more advantages than classical approaches in using prior informationindic
3、ating the hazard of testingconsidering the lossand dealing with the problem of multi-hypotheses.Conclusion Great attention should be paid to Bayesian theory. 【Key words】 hypothesis test Classical school Bayesian school 假设检验问题是统计学的传统问题,对于该问题,经典统计学派与贝叶斯学派有不同的处理思想。目前,经典统计方法占据着统计学的主导地位,但是,贝叶斯方法正在国外迅速发展并
4、得到日益广泛的应用,我们有必要给以足够的重视。本文结合一个例子,对两大学派的假设检验思想进行初步比较,以揭示两种思想的区别与联系,并着重探讨贝叶斯方法的优势。 两种假设检验思想 一、经典统计学派的假设检验思想 经典统计学派运用反证的思想进行推断,即:在认定一次实验中小概率事件不会出现的前提下,若观察到的事件是 H0 为真时不合理的小概率事件,则拒绝 H0。 上述思想可以用如下决策函数表示: 其中 x 代表样本信息。(x)取值为 0 时即为通常的“拒绝 H0”。 二、贝叶斯学派的假设检验思想 贝叶斯学派直接讨论 H0 和 H1 的后验概率,依据后验概率的大小进行推断。 其基本的解决方案是:在先验
5、分布 下,有决策函数 (x)取值为 0 时即“拒绝 H0”。很明显,它选择了后验概率较大的假设。 三、两种思想的联系与分歧 在经典统计学中,参数被看作未知常数,不存在参数空间,因而不存在 H0 和 H1 的概率,给出的是 P(x|H0 真),其中 x 代表样本信息。在贝叶斯方法中,参数被看成随机变量,在参数空间内直接讨论样本 x 下H0 和 H1 的后验概率,给出的是 P(H0 真|x)和 P(H0 不真|x)。 事实上,两个学派的方法在一定程度上统一于贝叶斯公式。 由贝叶斯公式容易得到: 因此,当 P(H0)=P(H1),即 H0 与 H1 居于平等地位时,经典学派与贝叶斯学派的结果是一致的
6、。 然而,H0 与 H1 地位往往不一致,H0 常居于将被否定的位置,因而上述一致性并不总能成立。贝叶斯学派对此进行了深入的探讨,他们的结果很有意义。 对于正态分布前提下的单侧检验:XN(,1),H0:0 H1:0,经典方法得到的 P 值与贝叶斯方法在无信息先验分布下的后验概率相等,此结论可以推广到正态分布前提下其他类似的单侧检验。 对于形如 H0:=0,H1:0,(或 H1:0)的单侧检验,情况则不同,与下述的双侧检验有类似结果。 对于形如 H0=0, H1:0 的双侧检验,经典方法得到的 P值与贝叶斯方法的后验概率大不相同。在 Berger 和 Sellke 1987 年对正态分布前提下二
7、者的比较研究中,当经典方法得到的 P 在 0.010.1 之间时,贝叶斯方法得到 H0 为真的后验概率大于 P,因而此时拒绝 H0 所承担的实际风险大于 P,而这个区间对于经典方法下结论是非常重要的。Hwang 和 Pematle 1994 年提出,对这类双侧检验,类似结果始终存在,因而 P 值应该由其他判断标准来替代。但他们还没有找到这种标准。 两种思想的应用 下面我们通过一个例子对两种假设检验思想进行一些比较。 例:以随机变量 代表某人群中个体的智商真值,i 为第 i 个个体的智商真值,随机变量 Xi 代表第 i 个个体的智商测验得分,若该人群的期望智商为 ,则第 i 个个体在一次智商测验
8、中的得分可以表示为:xij=i+eij=+ei+eij,其中 ei 为第 i 个个体的自然变异,eij 为第 i个个体第 j 次测量的测量误差。根据以往积累的资料,已知在某年龄儿童的智商真值 N(2),其中 =100=15,个体智商测验得分 XiN(i2),其中 =10。现在一名该年龄儿童智商测验得分为115,问:(1)该儿童智商真值是否高于同龄儿童的平均水平(即 i100)?(2)若取 i 在(ab)为正常,问该儿童智商是否属于正常? 一、用经典统计方法解答 对第一问,设 H0:i100 H1:i100,按照经典统计学方法,若 H0 成立,则有: 因此, 水平下的拒绝域为x:x100+u1-
9、 已知 i=10,若取 =0.05,有u0.95=1.645,100+101.645=116.45。 现有 x=115,因此,在 0.05 水平尚不能认为该儿童智商高于平均水平。 对第二问,经典方法需要进行两次分别针对 a、b 的单侧检验。过程与第一问相似,这里不再叙述。 二、用贝叶斯方法解答 在贝叶斯学派中,当 i 未知时,将其看作随机变量,与 具有相同的分布,这是贝叶斯学派与经典学派的一个重大区别。 根据贝叶斯理论,若 XN(,2),其中 2 已知, 未知,但已知 的先验分布是 N(,2),其中 和 2 均已知,则给定 x 后 的后验分布为 N(x)-1,)其中(证明参见文献1)。 由此得
10、到,本例中该儿童智商 i 的后验分布为 N(110.38,69.23)。对第一问,同样设 H0:i100 H1:i100,查正态分布表可以得到: P(H0:i100|x=115)=0.106, P(H1:i100|x=115)=0.894 根据风险最小原则拒绝 H0,接受 H1。 对第二问,设 H0:aib H1:ia 或 ib,查正态分布表可以分别得到 PH0:aib|x=115和 PH1:ia 或ib|x=115 ,类似第一问,依据风险最小原则作出推断。 讨 论 由上述分析和例子,我们可以看出,用贝叶斯方法处理假设检验问题至少在下述几方面具有明显优势。 一、先验信息利用的充分性和风险的直观
11、性 从前述问题的处理,我们清楚地看到,经典方法只使用了 Xi 的已有信息(贝叶斯学派称之为先验信息),而贝叶斯方法则同时利用了 Xi 和 的先验信息。因而在第二问的解决上,贝叶斯方法较经典方法少进行一次假设检验。 在贝叶斯方法中,由于导出了样本 x 下的后验分布,可以对风险给出正面的回答,因而较经典方法下的间接判断更直观。 二、可以将后续问题纳入考虑范围 如果推断错误在后续问题的解决过程中会造成一定损失,贝叶斯方法在进行推断时可将这一损失考虑在内。如: 在假设 H00,H11(0、1 是参数空间内两个互补子集)下,有: 等于 0,1 分别代表拒绝、接受 H0,a0、a1 分别代表了第一、第二类
12、错误造成的损失,这时,贝叶斯方法给出如下决策函数: 由于可以将假设检验结果带来的损失纳入检验考虑的范畴之内,因而对问题的回答更接近实用。 三、多重假设的处理不存在困难 对多重假设,如将前例第二问改为:若 i(ab)为智力正常,ia 为智力低下,ib 为智力超常,问该儿童智力属何种类型? 在现有条件下,经典方法很难处理这一问题。而贝叶斯方法对这一问题的解答并不存在特殊的困难,只需将假设设为:H0aib H1ia H2ib,多计算一个后验概率便可。 贝叶斯方法的上述优势对于解决实际问题很有帮助。 尽管在理论方面还存在一些困难,但不容否认的是,贝叶斯方法已经成为决策论的一个基本工具,在社会学、经济学等领域发挥着重要作用。在临床医学、预防医学、卫生事业管理等决策领域也一定能发挥重要作用。国内医学统计学界目前对贝叶斯方法的关注较少,加强这方面的研究工作,无疑将是有益的。
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。