1、第六章 相关与回归分析思考与练习一、判断题1.产品的单位成本随着产量增加而下降,这种现象属于函数关系。答:错。应是相关关系。单位成本与产量间不存在确定的数值对应关系。2.相关系数为 0 表明两个变量之间不存在任何关系。答:.错。相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系。3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。答:对,因果关系的判断还有赖于实质性科学的理论分析。4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。答:错。两者是精确的函数关系。5.总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。答
2、:对。6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。答:对。因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同,估计的结果仍然不一样。二、选择题1.变量之间的关系按相关程度分可分为:b、c、da.正相关; b. 不相关; c. 完全相关; d.不完全相关;2.复相关系数的取值区间为:aa. ; b. ; c. ; d.10R1R1RR3.修正自由度的决定系数 a、b、da. ; b.有时小于 0 ; c. ;2 2d.比 更适合作为衡量回归方程拟合程度的指标4.回归预测误差的大小与下列因素有关:a、b、c、da 样本容量; b 自变量预测值与自变
3、量样本平均数的离差c 自变量预测误差; d 随机误差项的方差三、问答题1请举一实例说明什么是单相关和偏相关?以及它们之间的差别。答:例如夏季冷饮店冰激凌与汽水的消费量,简单地就两者之间的相关关系进行考察,就是一种单相关,考察的结果很可能存在正相关关系,即冰激凌消费越多,汽水消费也越多。然而,如果我们仔细观察,可以发现一般来说,消费者会在两者中选择一种消费,也就是两者之间事实上应该是负相关。两者之间的单相关关系出现正相关是因为背后还有天气等因素的影响,天气越热,两种冷饮的消费量都越多。如果设法将天气等因素固定不变,单纯考察冰激凌与汽水的消费量,则可能出现负相关关系。像这种假定其他影响因素不变专门
4、考察其中两个因素之间的关系就成为偏相关。2讨论以下几种场合,回归方程 中回归系数的经济意义和应tttt uXY321取的符号。(1) Yt为商业利润率; X2t为人均销售额; X3t为流通费用率。(2) Yt为粮食销售量; X2t为人口数; X3t为人均收入。(3) Yt为工业总产值; X2t为占用的固定资产; X3t为职工人数。(4) Yt为国内生产总值; X2t为工业总产值; X3t 为农业总产值。答:(1) ,023人均销售额越大,企业利润越高,故此商业利润率越高,从而商业利润率与人均销售额呈正相关关系;而流通费用率越高,反映商业企业的经营成本越高,其商业利润率就越低。(2) ,03人口
5、数量越多,对粮食的消费量就越大;人均收入越多,对粮食的购买力就越强,故此这两个变量皆与粮食销售量呈正相关关系。(3) ,23固定资产和职工人数是两大生产要素,数量越多,说明生产要素越密集,工业总产值就越高,所以它们与工业总产值的关系为正相关。(4) , ,01203因为国内生产总值包括三次产业,所以工业总产值、农业总产值和全部的国内生产总值为正相关关系,同时即便某些特殊地区没有工业和农业,仍然有国内生产总值,所以,。01四、计算题1设销售收入为自变量,销售成本为因变量。现根据某百货公司 1个月的有关资料计算出以下数据:(单位:万元)= 425053.73 ; = 647.88; = 26285
6、5.25 ; = 2)(Xt X2)(Yt Y549.8; = 334229.09)(Ytt(1) 拟合简单线性回归方程,并对方程中回归系数的经济意义做出解释。(2) 计算决定系数和回归估计的标准误差。(3) 对 2 进行显著水平为的显著性检验。(4)假定明年月销售收入为 800 万元,利用拟合的回归方程预测相应的销售成本,并给出置信度为的预测区间。 解:(1) 7863.0.42593)(22 XYt26*78.054921(2) 22)()(YXYrtt9834.025.68*73.42509)()1(Yret 089.2nSte(3) :,:2120H0324.7.4589)(22 XS
7、Ste 1.03.78622t 2.)()(5./ tntt 值远大于临界值 2.228,故拒绝零假设,说明 在 5的显著性水平下通过了显著性2检验。(4) (万元)41.6980*73.2.0fY所以,Y f 的置信度1429.73.250)8(.)(12 XnStfef为 95的预测区间为: 6.496.1*8.469)(2/ feftY所以,区间预测为: 18.764.f2. 对 9 位青少年的身高 Y 与体重 X 进行观测,并已得出以下数据 :, , , ,i13.54Y978.2i i4722815iX0iX要求:(1)以身高为因变量,体重为自变量,建立线性回归方程;(2)计算残差平
8、方和决定系数;(3)计算身高与体重的相关系数并进行显著性检验;(自由度为 7,显著水平为 0.05的 t 分布双侧检验临界值为 2.365。 )(4)对回归系数 进行显著性检验。2解: (1) 2222 )()( ttt XNYXY073.4*7815*9.30. 2.9/2./.21 Y(2)决定系数: 73.0)()(22YXrtt残差平方和 .)()1(222ret(3)身高与体重的相关系数: 9861.073.2Rr不 同 时 为 零和 2110:,:H06.2neSte检验统计量 9134.25)(2etSXF)(2,1NtF 值远大于临界值 2.365,故拒绝零假设,说明回归方程在
9、 5的显著性水平下通过了显著性检验。(4) 0:,:2120H5.34.7)(22 XSte6.50.22St 3.2)7()(5./ tntt 值远大于临界值 2.365,故拒绝零假设,说明 在 5的显著性水平下通过了显著性2检验。3我国 2004 年部分副省级大中城市的有关资料如下表。城市 人均消费支出Y(元/人)人均可支配收入X1 (元/人)人均储蓄X2 (元/人)沈阳 7213 8924 22470.93大连 8672 10378 26185.59哈尔滨 6896 8940 13402.76南京 8350 11602 24994.58武汉 7793 9564 19175.46济南 84
10、71 10798 15298.77青岛 9002 11089 16495.77杭州 11213 14565 29083.99宁波 11283 15882 23257.83武汉 7793 9564 19175.46广州 13121 16884 59786.52厦门 10739 14443 38261.19资料来源:厦门市统计局网站,其中人均储蓄根据储蓄额与人口数推算。试根据该表的资料,(1) 拟合以下形式的消费函数: Yt 1 2X1t 3X2t Ut(2) 计算随机误差项的标准差估计值、修正自由度的决定系数,并对整个回归方程进行显著性检验。(3) 假设某一居民家庭人均可支配收入为 12,000
11、 元,人均储蓄为 40000 元,试预测其人均消费支出,并给出置信度为的预测区间。解:(1)回归分析的 EXCEL 操作步骤为:步骤一:首先将数据粘贴导入 EXCEL 数据表中。步骤二:进行回归分析选择“工具” “数据分析” “回归” ,在该窗口中选定自变量和因变量的数据区域,最后点击“确定”完成操作:得到回归分析的输出结果见下图。因此回归方程为: ttt XY21045.5879.016.59(2)随机误差项的标准差估计值为:S369.3716,修正的决定系数为: 。963.02R不 同 时 为 零和、 213210:,: HHF=145.4606 远大于 F 统计量的临界值 4.10,说明
12、回归方程在 5的显著性水平下通过检验。(3)预测点估计值为: 158.96340*25.10*5879.016.59 fC使用 EXCEL 进行区间估计步骤如下:步骤一:构造工作表步骤二:为方便后续步骤书写公式,定义某些单元格区域的名称首先,定义 F6、F7 、F8 的名称:选定 E6:F8 区域,然后执行菜单命令“插入”“名称”“指定” ,在调出的对话框中选中“最左列” ,单击“确定”:其次,定义 B2:D13 的名称:先选定该区域,然后执行然后执行菜单命令“插入”“名称”“定义”:调出“定义名称”对话框,输入名称“X ”,单击“确定” 。最后,采用同样方法,将 B15:D15 定义为“Xf
13、” ,将 F2:F4 定义为“B” 。步骤三:计算点预测值 fC在 F6 中输入公式“=MMULT(Xf,B)” ,按回车键即可。步骤四:计算 t 临界值在 F7 中输入公式“=TINV(1-0.95,12-3)” ,按回车键即可。步骤五:计算预测估计误差的估计值 feS在 F5 中输入公式:“=MMULT(MMULT(Xf,MINVERSE(MMULT(TRANSPOSE(X),X),TRANSPOSE(Xf)”然后按“Ctrl+Shift+Enter”组合键即可。再计算 ,在 F8 中输入公式“=369.3716*SQRT(1+F5)” 。369.3716 为回归估计标准feS差。步骤六:
14、计算置信区间上下限在 F9、F10 中分别输入公式“=Cf-t 临界值*Sef”和“=Cf+t 临界值*Sef” 。结果为:最终得出 的区间预测结果:fC6108.5770.865f4.设有以下资料(1)试拟合以下总成本函数tttt uXY342321(2)根据总成本函数推导出平均成本函数,并描出平均成本函数的图形。(3)试根据以上结果推算总产量为 1550 时的单位产品平均成本。某企业近年来总成本与产量年份 总成本Y产量 X年份 总成本 Y产量 X1997 32900 400 2003 86300 9001998 52400 600 2004 139000 12001999 42400 500 2005 115700 11002000 62900 700 2006 154800 13002001 74100 800 2007 178700 14002002 100000 1000 2008 203100 1500解:(1)构造 EXCEL 数据表,并与前面所述的同样步骤进行回归分析,得到相应的回归分析结果(见下页) 。得到的回归方程为: 32048.17.0739.852.40 tttt XXY(2)求平均成本函数:因为平均成本 与总成本 的关系为: ,所以tytYttXYy20348.17.039.852.40 ttttXy
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。