1、第十二章 相关与回归分析第一节 变量之间的相关关系相关程度与方向因果关系与对称关系第二节 定类变量的相关双变量交互分类(列联表)削减误差比例(PRE)系数与系数第三节 定序变量的相关分析同序对、异序对和同分对Gamma系数肯德尔等级相关系数(a系数、b与c系数)萨默斯系数(d系数)斯皮尔曼等级相关(相关)肯德尔和谐系数第四节 定距变量的相关分析相关表和相关图积差系数的导出和计算积差系数的性质第五节 回归分析线性回归积差系数的PRE性质相关指数R第六节 曲线相关与回归可线性化的非线性函数实例分析(二次曲线指数曲线)一、填空1对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般
2、是( 随机性 )变量。2变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是( 削减误差比例 )。3依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值是服从( );(2)分布中围绕每个可能的值的( )是相同的。4在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。5根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系
3、进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。6积差系数r是( 协方差 )与X和Y的标准差的乘积之比。二、单项选择1当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在( A )关系。A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关2评价直线相关关系的密切程度,当r在0.50.8之间时,表示( C )。A 无相关 B 低度相关 C 中等相关 D 高度相关3相关分析和回归分析相辅相成,又各有特点,下面正确的描述有( D )。A在相关分析中,相关的两变量都不是随机的;B在回归分析中,
4、自变量是随机的,因变量不是随机的;C在回归分析中,因变量和自变量都是随机的;D在相关分析中,相关的两变量都是随机的。4关于相关系数,下面不正确的描述是( B )。A当01时,表示两变量不完全相关;B当r=0时,表示两变量间无相关;C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。 5欲以图形显示两变量X和Y的关系,最好创建( D )。A 直方图 B 圆形图 C 柱形图 D 散点图6两变量X和Y的相关系数为0.8,则其回归直线的判定系数为( C )。A 0.50 B 0.80 C 0.64 D 0.907在完成了构造与评价一个回归模型后,我们可以( D )。
5、A 估计未来所需样本的容量B 计算相关系数和判定系数C 以给定的因变量的值估计自变量的值D 以给定的自变量的值估计因变量的值8两变量的线性相关系数为0,表明两变量之间( D )。A 完全相关 B 无关系 C 不完全相关 D 不存在线性相关9身高和体重之间的关系是( C )。A 函数关系 B 无关系 C 共变关系 D 严格的依存关系10在相关分析中,对两个变量的要求是( A )。A 都是随机变量 B 都不是随机变量C 其中一个是随机变量,一个是常数 D 都是常数11在回归分析中,两个变量( D )。A 都是随机变量 B 都不是随机变量C 自变量是随机变量 D 因变量是随机变量12一元线性回归模型
6、和多元线性回归模型的区别在于只有一个( B )。A 因变量 B 自变量 C 相关系数 D 判定系数13以下指标恒为正的是( D )。A 相关系数r B 截距a C 斜率b D 复相关系数14下列关系中,属于正相关关系得是( A )。A 身高与体重 B 产品与单位成本C 正常商品的价格和需求量 D 商品的零售额和流通费率三、多项选择1关于积差系数,下面正确的说法是( ABCD )。A 积差系数是线性相关系数B 积差系数具有PRE性质C 在积差系数的计算公式中,变量X和Y是对等关系D 在积差系数的计算公式中,变量X和Y都是随机的2关于皮尔逊相关系数,下面正确的说法是( )。 A 皮尔逊相关系数是线
7、性相关系数 B 积差系数能够解释两变量间的因果关系 C r公式中的两个变量都是随机的 D r的取值在1和0之间E 皮尔逊相关系数具有PRE性质,但这要通过r2加以反映3简单线性回归分析的特点是( ABE )。A 两个变量之间不是对等关系B 回归系数有正负号C 两个变量都是随机的D 利用一个回归方程,两个变量可以互相推算E 有可能求出两个回归方程4反映某一线性回归方程y=a+bx好坏的指标有( ABD )。A 相关系数 B 判定系数C b的大小 D 估计标准误 E a的大小5模拟回归方程进行分析适用于( ACDE )。A 变量之间存在一定程度的相关系数B 不存在任何关系的几个变量之间C 变量之间
8、存在线性相关D 变量之间存在曲线相关E 时间序列变量和时间之间6判定系数r2=80%和含义如下( ABC )。A 自变量和因变量之间的相关关系的密切程度B 因变量y的总变化中有80%可以由回归直线来解释和说明C 总偏差中有80%可以由回归偏差来解释D 相关系数一定为0.64 E 判定系数和相关系数无关7回归分析和相关分析的关系是( ABE )。A 回归分析可用于估计和预测B 相关分析是研究变量之间的相互依存关系的密切程度C 回归分析中自变量和因变量可以互相推导并进行预测D 相关分析需区分自变量和因变量E 相关分析是回归分析的基础8以下指标恒为正的是( BC )。A 相关系数 B 判定系数 C
9、复相关系数 D 偏相关系数 E 回归方程的斜率9一元线性回归分析中的回归系数b可以表示为(BC)A 两个变量之间相关关系的密切程度B 两个变量之间相关关系的方向C 当自变量增减一个单位时,因变量平均增减的量D 当因变量增减一个单位时,自变量平均增减的量E 回归模型的拟合优度10关于回归系数b,下面正确的说法是( )。 A b也可以反映X和Y之间的关系强度。; B 回归系数不解释两变量间的因果关系; C b公式中的两个变量都是随机的; D b的取值在1和-1之间;E b也有正负之分。四、名词解释1消减误差比例变量间的相关程度,可以用不知Y与X有关系时预测Y的误差,减去知道Y与X有关系时预测Y的误
10、差,再将其化为比例来度量。将削减误差比例记为PRE。2 确定性关系当一个变量值确定后,另一个变量值夜完全确定了。确定性关系往往表现成函数形式。3非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。4因果关系变量之间的关系满足三个条件,才能断定是因果关系。1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。5单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。三个或三
11、个以上的变量之间的相关关系则称为复相关,又称多元相关。6正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。7散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X与Y的相互关系,即得相关图,又称散点图。8皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量X、Y的标准差乘积的比率。9同序对在观察X序列时,如果看到,在Y中看到的是,则称这一配对是同序对。10异序对在观察X序列时,如果看到,在Y中看到的是,则称这一配对是异序对。11同分对如果在X序列中,我们观察到(此时Y序列中无),则这个
12、配对仅是X方向而非Y方向的同分对;如果在Y序列中,我们观察到(此时X序列中无),则这个配对仅是Y方向而非X方向的同分对;我们观察到,也观察到,则称这个配对为X与Y同分对。五、判断题1由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。 ( )2不管相关关系表现形式如何,当1时,变量X和变量Y都是完全相关。( )3不管相关关系表现形式如何,当0时,变量X和变量Y都是完全不相关。( )4通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着Y的相对频数条件分布相同,且和它的相对频数
13、边际分布相同。 ( ) 5如果众数频数集中在条件频数分布列联表的同一行中,系数便会等于0,从而无法显示两变量之间的相关性。 ( )6从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。 ( )六、计算题1对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:转化为相对频数的联合分布列联表转化为相对频数的条件分布列联表;指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。 对于民族音乐的态度(Y)年岁(X)老 中 青 喜 欢 不喜欢38 38 3015 33 4
14、62已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。身高(cm)171167177154169体重(kg)5356644955身高(cm)175163152172162体重(kg)6652475850【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X】3假定有不同文化程度的3545岁育龄妇女100人的生育情况如下表,求文化程度与平均生育数的相关系数r。序号一二三四五育龄妇女人数2020202020文化程度(年)平均生育数
15、04.7463.3193.08122.41161.944某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。环境名次397512810211416体质名次596712811110324【斯皮尔曼相关系数:0.94,肯德尔等级相关系数:0.83】5以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数和肯德尔相关系数c。 文化程度婚姻美满大学中学小学美 满9165一 般83018不美满347【c=0.18】6以下为两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系
16、数来描述两评判员打分的接近程度。参赛人ABCDEFGHIJ评判员1评判员21122433455866778991010【斯皮尔曼相关系数:0.95】7某原始资料为:X65739188765396678285Y571313.574.5156.71011要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;(4)用积差法求相关系数。 【Y=-11.48+0.27X】【正相关】【相关系数r=0.95】8两变量X、Y之间的关系如下表,X24681012Y14109754(1)求回归方程; (2)求相关系数。 【Y=-0.957X+14.867】【r=0.98】9试就下表所示资料,计
17、算关于身高和体重的皮尔逊相关系数。N0身高(厘米)体重(千克)1 2 3 4 5 6 7 8 910 160 161 165 165 167 170 172 174 176 18051565966637069738065【r=0.77】10青年歌手大奖赛评委会对10名决赛选手的演唱水平(X)和综合素质(Y)进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的肯德尔等级相关系数及斯皮尔曼等级相关系数。 选手名 A B C D E F G H I J 演唱水平(X)综合素质(Y) 1 2 3 4 5 6 7 8 9 10 3 1 5 2 7 4
18、10 8 6 9 【肯德尔系数:0.56,斯皮尔曼系数:0.76】11青年歌手大奖赛,假设五位评委对10名决赛选手的演唱水平进行排序,他们的有关评价结果列于下表,试通过计算肯德尔和谐系数,检验专家意见的一致性和相关程度。 五位评委 10名决赛选手 A B C D E F G H I J A B C D E 1 2 3 4 5 6 7 8 9 10 3 2 1 4 5 8 9 7 10 6 1 3 2 4 8 7 6 5 9 10 4 2 1 5 3 10 8 6 7 9 5 2 1 9 3 8 4 6 10 7 【0.76】12某地区失业率与通货膨胀率之间的资料如下表所示,试求:(1)拟合指数
19、回归方程;(2)失业率与通货膨胀率之间的相关系数。失业率(%)1.0 1.6 2.0 2.5 3.1 3.6 4.0 4.5 5.1 5.6 6.0 6.5通胀率(%)1.6 1.5 1.1 1.3 0.6 0.9 0.8 0.8 0.7 0.6 0.6 0.6【】【相关系数0.76】13试就下表所示资料,求算员工工作满足感高与归属感之Gamma系数,并解释Gamma系数具有削减误差比例PRE性质。工作满足感与归属感 归属感(Y) 工作满足感(X) 低(1) 中(2) 高(3) 低(1) 中(2) 高(3) 8 4 3 6 5 1 4 4 5151213 Fx 18 13 9 40【G=0.0
20、92】14已知相关系数r0.6,估计标准误差8,样本容量为62。求: 1)剩余变差值;2)剩余变差占总变差的百分比;3)求总变差值。15在相关和回归分析中,已知下列资料:16,25,19,a30。要求:1)计算相关系数r,说明相关程度;2)求出直线回归方程。16在相关和回归分析中,已知下列有关资料:5,10,n20,r0.9,2000。试计算:1)回归系数b;2)回归变差和剩余变差;3)估计标准误差。17根据下述假设资料求回归方程。X1234567Y23.023.424.125.226.126.927.318某10户家庭样本具有下列收入(元)和食品支出(元/周)数据:收入(X)20303340
21、151326382543支出(Y)7981154810910要求:1)写出最小平方法计算的回归直线方程; 2)在95.46把握下,当X45时,写出Y的预测区间。19根据下述假设资料,试用积差法求相关系数。输出X(亿元)12106168910输出Y(亿元)1286111081120对40个企业的横截面样本数据进行一元回归分析,因变量与其平均数的离差平方和为6000,而回归直线拟合的剩余变差为2000,求:1)变量间的相关指数R;2)该方程的估计标准误差。七、问答题1简述积差系数的特性。2简述回归分析和相关分析之间的密切联系。部分计算参考:(见计算题六)2. 已知十名学生身高和体重资料如下表,(1
22、)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。编号身高(cm)体重(kg)1171532167563177644154495169556175667163528152479172581016250皮尔逊相关系数与回归方程 编号 身高(cm)x体重(kg)yxy117153292412809906321675627889313693523177643132940961132841544923716240175465169552856130259295617566306254356115507163522
23、6569270484768152472310422097144917258295843364997610162502624425008100合计16625502768623060091830斯皮尔曼相关系数编号身高(cm)次序体重(kg)次序d1171453 6-242167656 4243177164 2-114154949 9005169555 50 06175266 11 17163752 70 081521047 100 09172358 30 010162850 80 0合计104. 某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生
24、体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。环境名次397512810211416体质名次596712811110324斯皮尔曼等级相关系数环境名次体质名次d35 -249900761157-2412120088001011-112111111011431112-116424合计18肯德尔等级相关系数ABCDEFGHIJKL环境名次(x)397512810211416体质名次(y)596712811110324 1) A: 同序对 AC AB AD AE AF AG AH AI AK 9 异序对 AJ AL 2 2) B: 同序对 BC BD BG BH BI BJ BK BL BE B
25、F 10 3) C: 同序对 CE CF CG CH CI CJ CK CL 8 异序对CD 1 4 D: 同序对 DE DF DG DH DI DJ DK 7 异序对 DL 1 5) E: 同序对 EG EH EI EJ EK EL EF 7 6) F: 同序对 FG FH FI FJ FK FL 6 7) G: 同序对 GH GJ GK GL 4 异序对GI 1 8) H: 同序对 HI HJ HK HL 4 9) I: 同序对 IJ IK IL 3 10)J: 同序对 JK JL 2 11)K: 同序对 KL 1合计:同序对 异序对5. 以下是婚姻美满与文化程度的抽样调查的结果,请计算婚
26、姻美满与文化程度Gamma系数和肯德尔相关系数c。 文化程度婚姻美满大学中学小学美 满9165一 般83018不美满347=9(30+18+4+7)+16(18+7)+8(4+7)+307=1229=5(30+8+3+4)+18(3+4)+16(8+3)+303=6170.186以下试两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。参赛人ABCDEFGHIJ评判员1评判员21122433455866778991010参赛人评审员1评审员2dA1100B2200C4311D34-11E5500F8624G67-11H78-11I9900J101000合计
27、87某原始资料为:X65739188765396678285Y571313.574.5156.71011要求:(1)求回归方程; (2)这是正相关还是负相关;【正相关】 (3)求估计标准误差; (4)用积差法求相关系数。XY xy6554225253257375329495119113828116911838813.57744182.251188767577649532534.5280920.25238.5961592162251440676.7448944.89448.9821067241008208511722512193577692.761818985.397621.417根据下述假设资
28、料求回归方程。X1234567Y23.023.424.125.226.126.927.3编号xy xy1123.01529232223.44547.5646.83324.19580.8172.34425.216635.04100.85526.125681.21130.56626.936723.61161.47727.349745.29191.1合计28176.01404442.52725.97rab0.99283222.01430.78214318某10户家庭样本具有下列收入(元)和食品支出(元/周)数据:收入(X)20303340151326382543支出(Y)7981154810910要
29、求:1)写出最小平方法计算的回归直线方程; 2)在95.46把握下,当X45时,写出Y的预测区间。收入(X)支出(Y) xy2074004914030990081270338108964264401116001214401552252575134169165226867664208381014441003802495768121643101849100430282818928701247519根据下述假设资料,试用积差法求相关系数。输出X(亿元)12106168910输出Y(亿元)12861110811输出x(亿元)输出y(亿元 xy12121441441441081006480663636361611256121176810641008098816472101110012111016
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。