应用多元统计分析课后答案_朱建平版.doc

上传人:坚持 文档编号:2097954 上传时间:2019-04-23 格式:DOC 页数:17 大小:1.39MB
下载 相关 举报
应用多元统计分析课后答案_朱建平版.doc_第1页
第1页 / 共17页
应用多元统计分析课后答案_朱建平版.doc_第2页
第2页 / 共17页
应用多元统计分析课后答案_朱建平版.doc_第3页
第3页 / 共17页
应用多元统计分析课后答案_朱建平版.doc_第4页
第4页 / 共17页
应用多元统计分析课后答案_朱建平版.doc_第5页
第5页 / 共17页
点击查看更多>>
资源描述

1、第三章3.1 试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。其基本思想和步骤均可归纳为:答: 第一,提出待检验的假设 和 H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受) 。均值向量的检验:统计量 拒绝域在单一变量中当 已知 20()Xzn /2|z当 未知 tS /|(1)tn( 作为 的估计量)221()niiS2一个正态总体 00H:协差阵 已知 21200()()(TnpX20T协差阵 未知 21),pFn(1)

2、npF( ) 2 100()()()nSX两个正态总体 012H:有共同已知协差阵 12()()(mTpnY20T有共同未知协差阵 2,1)pFTFnmF(其中 )2 1()()()nTnmn XSX协差阵不等 -,pFFpZF协差阵不等 n1()(,)nn-S多个正态总体 kH210:单因素方差 (1)(,)SAFFnkEnF多因素方差 ,1pT协差阵的检验检验 0pHI:/2/21expnpetrS00:/*nt检验 12k 12k:统计量 /2/2/211i iknpnnpki iS3.2 试述多元统计中霍特林 分布和威尔克斯 分布分别与一元统计中 t 分布和 F 分布的关系。答:(1)

3、霍特林 分布是 t 分布对于多元变量的推广。而若设 , 且 与22 21()()()nXt SXS (,)pN(,)pWnSX相互独立, ,则称统计量 的分布为非中心霍特林 T2 分布。p若 , 且 与 相互独立,令 ,则 (,)pN0(,)pWnSS21TnS。21,1nTF(2 ) 威尔克斯 分布在实际应用中经常把 统计量化为 统计量进而化为 统计量,2TF利用 统计量来解决多元统计分析中有关检验问题。与 统计量的关系Fp1n2统计量及分别F任意 任意 1 111(,)(,)npnFp 任意 任意 2 11 1(,2)(,)npn1 任意 任意 112212(,)(,)F2 任意 任意 1

4、21 212(,)(,)nnn 第四章4.1 简述欧几里得距离与马氏距离的区别和联系。答: 设 p 维欧几里得空间 中的两点 X= 和 Y= 。则欧几里得距离为 。欧几里得距离的局限有在多元数据分析中,其度量不合理。会受到实际问题中量纲的影响。设 X,Y 是来自均值向量为 ,协方差为 的总体 G 中的 p 维样本。则马氏距离为D(X,Y)= 。当 即单位阵时,D(X,Y)= =即欧几里得距离。因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2 试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,

5、能把属于不同类别的样本点尽可能地区别开来。设 R1,R2,Rk 是 p 维空间 R p 的 k 个子集,如果它们互不相交,且它们的和集为 ,则称 为 的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对 p 维空间 构造一个“划分” ,这个“划分”就构成了一个判别规则。4.3 简述距离判别法的基本思想和方法。答:距离判别问题分为两个总体的距离判别问题和多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离) ,将距离近的判别为一类。两个总体的距离判别问题设有协方差矩阵 相等的两个总体 G1和 G2,其均值分别是 1和 2,对于一个新的样品X,要判断它来自哪个总体。计

6、算新样品 X 到两个总体的马氏距离 D2( X, G1)和D2( X, G2) ,则X , D2(X , G1) D2(X,G 2)X , D2(X , G1) D2(X,G 2,具体分析,221(,)(,)112211221 12112()()() X21122()()()()记 则判别规则为 WXX ,W(X)X ,W(X)0多个总体的判别问题。设有 个总体 ,其均值和协方差矩阵分别是 k,21 和 ,kkG,21 k,21且 。计算样本到每个总体的马氏距离,到哪个总体的距离最小就21属于哪个总体。具体分析, 21(,)()()DXX1()CI取 , , 。I112 k,2可以取线性判别函

7、数为, ()WXI,相应的判别规则为 若 iG1()max()ikWCXI4.4 简述贝叶斯判别法的基本思想和方法。基本思想:设 k 个总体 kG,21 ,其各自的分布密度函数 ,假设)(,)(,21xxkffk 个总体各自出现的概率分别为 , , 。设将本来属于 总体的q, 0i kiqiG样品错判到总体 时造成的损失为 , j,2 。j )|(jC设 个总体 kG,21 相应的 维样本空间为 。p),(1kR在规则 下,将属于 i的样品错判为 的概率为RjxdfRjPji)(),|(jiji,则这种判别规则下样品错判后所造成的平均损失为kj RijPCir1),|()|)|( ki,21则

8、用规则 来进行判别所造成的总平均损失为 kiRqg1),()(kij ijP),|(|贝叶斯判别法则,就是要选择一种划分 kR,21 ,使总平均损失 达到极小。)(Rg基本方法: kij ijCqRg1),|()|)(xdfkijRij1|kjRiij fjq1)(|(令 ,则 |)kiijCfhxkjRjdhg1)(x若有另一划分 ,),(*2*1kkjj*)(则在两种划分下的总平均损失之差为kijRjiji dhgR1*)()( x因为在 上 对一切 成立,故上式小于或等于零,是贝叶斯判别的解。i )(xjih从而得到的划分 为 ),21k 1|()min()iijkhxki,214.5

9、简述费希尔判别法的基本思想和方法。答:基本思想:从 个总体中抽取具有 个指标的样品观测数据,借助方差分析的思想构kp造一个线性判别函数12()UuXuX系数 可使得总体之间区别最大,而使每个总体内部的离差最小。将新),(21pu样品的 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可p()UX以判别新的样品属于哪个总体。4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答: 费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。 当 k=2 时,若 则费希尔判别与距离判别

10、等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。 当 时,费希尔判别用 作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。 距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是 X ,W(X)X ,W(X)lnd距离判别的判别规则是X ,W(X)X ,W(X)0二者的区别在于阈值点。当 , 时, , 。二者完全21q)1|2()|(Cd0ln相同。第五章5.1 判别分析和聚类分析有何区别?答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有 n 个样本,对每个样本测得 p 项指标(变量)的数据,已知每个样本属于 k 个类别(或总体)中的某一类,通过找

11、出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。5.2 试述系统聚类的基本思想。答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。5.3 对样品和变量进行聚类分析时, 所构造的统计量分别是什么?简要说明为什么这样构造?答:对样品进行聚类分析

12、时,用距离来测定样品之间的相似程度。因为我们把 n 个样本看作 p 维空间的 n 个点。点之间的距离即可代表样品间的相似度。常用的距离为(一)闵可夫斯基距离:1/1()pqij ikjkdqXq 取不同值,分为(1 )绝对距离( )11()pij ikjkkdX(2 )欧氏距离( )2q21/1()pij ikjkd(3 )切比雪夫距离( )q1()maxij ikjkkpX(二)马氏距离 (三)兰氏距离对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。将变量看作 p 维空间的向量,一般用(一)夹角余弦(二)相关系数2 1()()()ij ijijdMXX 1()

13、pikjij ijL 122cos()pikjijikjkX1221()()pikijkjij pikijkjXrX5.4 在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则?答: 设 dij 表示样品 Xi与 Xj之间距离,用 Dij 表示类 Gi与 Gj之间的距离。(1 ) . 最短距离法 ,minikjrkr ijXGDdn,kpq(2 )最长距离法 ,axipjqpqijXGd,mikjrkrijDax,kpqD(3 )中间距离法其中(4 )重心法2()()pqpqpqDXX )(1qprXn2222pqpqkrkkrrnnD(5 )类平均法221ipjpqij

14、XGDdn221ikjrkr ijXGrdn22pqkkrrnD(6 )可变类平均法其中 是可变的且 1(7 )可变法ijij ji, 2221pqkqkpkr 2222(1)pqkrkkpqrrnD 其中 是可变的且 12221()krkpqpqDD(8 )离差平方和法 1()()tntittittSXX2222kpkqkr kpqrrnnnDD通常选择距离公式应注意遵循以下的基本原则:(1 )要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。(2 )要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之

15、前已经对变量作了标准化处理,则通常就可采用欧氏距离。(3 )要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的结果进行对比分析,以确定最合适的距离测度方法。5.5 试述 K 均值法与系统聚类法的异同。答:相同:K均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。不同:系统聚类对不同的类数产生一系列的聚类结果,而 K均值法只能产生指定类数的聚类结果。具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品

16、为对象进行聚类,其结果作为 K均值法确定类数的参考。5.6 试述 K 均值法与系统聚类有何区别?试述有序聚类法的基本思想。答:K 均值法的基本思想是将每一个样品分配给最近中心(均值)的类中。系统聚类对不同的类数产生一系列的聚类结果,而 K均值法只能产生指定类数的聚类结果。具体类数的确定,有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为 K 均值法确定类数的参考。有序聚类就是解决样品的次序不能变动时的聚类分析问题。如果用 表示)()2()1,nX个有序的样品,则每一类必须是这样的形式,即 ,其中 且n )()1(),jiiXi,简记为 。在同一类中的样品是次序相邻的。一般的步骤是j

17、,1,jiGi(1 )计算直径D(i,j)。 (2)计算最小分类损失函数Lp(l,k)。(3)确定分类个数 k。 (4 )最优分类。第六章6.1 试述主成分分析的基本思想。答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合。继续这个过程,直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。6.2 主成分分析的作用体现在何处?答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机

18、向量;主成分分析的作用就是在降低数据“维数”的同时又保留了原数据的大部分信息。6.3 简述主成分分析中累积贡献率的具体含义。答:主成分分析把 个原始变量 的总方差 分解成了 个相互独立的变p12,pX ()trp量 的方差之和 。主成分分析的目的是减少变量的个数,所以一般不会使用12,pY k所有 个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来太大的影响。这里我们称 为第 个主成分 的贡献率。第一主成分的贡献率最大,这表明1kkkY综合原始变量 的能力最强,而 的综合能力依次递减。若1YTX2,pX 23,pY只取 个主成分,则称 为主成分 的累计贡献率,累计贡()mp1mk1,m

19、献率表明 综合 的能力。通常取 ,使得累计贡献率达到一个较高1,mY 12,p的百分数(如 85以上) 。6.4 在主成分分析中“原变量方差之和等于新的变量的方差之和”是否正确? 说明理由。答:这个说法是正确的。即原变量方差之和等于新的变量的方差之和6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。从协方差矩阵出发的,其结果受变量单位的影响。主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。实际表明,这种差异有时很大。我们认为,如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用 R 代替。对于研究经济问题所涉及的变量单位大都不统一,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 试题真题

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。