回归7-1.doc

上传人:心*** 文档编号:637978 上传时间:2018-10-24 格式:DOC 页数:15 大小:467.50KB
下载 相关 举报
回归7-1.doc_第1页
第1页 / 共15页
回归7-1.doc_第2页
第2页 / 共15页
回归7-1.doc_第3页
第3页 / 共15页
回归7-1.doc_第4页
第4页 / 共15页
回归7-1.doc_第5页
第5页 / 共15页
点击查看更多>>
资源描述

1、1第七章 回归分折讨论随机变量与非随机变量之间的关系的问题称回归分析;讨论随机变量之间的关系的问题称相关分析对于这两种问题,或统称回归分析,或统称相关分析都可以但是,自然界的众多的变量间,还有另一类重要关系,我们称之为相关关系例如,施肥量与农作物产量之间的关系,这种关系虽不能用函数关系来描述,但施肥量与产量有关系,这种关系就是相关关系,又比如,人的身高与体重的关系也是相关关系,虽然人的身高不能确定体重,但总的说来,身高者,体也重些,总之,在生产斗争与科学实验中,甚至在日常生活中,变量之间的相关关系是普遍存在的其实,即使是具有确定性关系的变量间,由于实验误差的影响,其表现形式也具有某种的不确定性

2、回归分折方法是数理统计中一个常用方法,是处理多个变量之间相关关系的一种数学方法,它不仅提供了建立变量间关系的数学表达-通常称为经验公式的一般方法,而且还可以进行分析,从而能判明所建立的经验公式的有效性,以及如何利用经验公式达到预测与控制的目的因而回归分析法得到了越来越广泛地应用 回归分析主要涉及下列内容:(1)从一组数据出发,分析变量间存在什么样的关系,建立这些变量之间的关系式(回归方程),并对关系式的可信度进行统计检验;(2)利用回归方程式,根据一个或几个变量的值,预测或控制男一个变量的取值;(3)从影响某一个变量的许多变量中,判断哪些变量的影响是显著的,哪些是不显著的,从而可建立更实用的回

3、归方程,(4)根据预测和控制所提出的要求,选择试验点,对试验进行设计我们在本章,重点讨论一元线性回归,对多元回归只作简单地介绍1 一元线性回归一元线性回归分析中要考察的是:随机变量 与一个普通变量 之间的联系。Yx对有一定联系的两个变量:与 ,x我们的任务是根据一组观察值 1, 2, ,(),(),(),nxyyxy2判断 与 是否存在线性关系Yx, yabx我们能否通过这组观察值将确定系数 与 出来呢?这就是回归问题要解决的问题,且判断 与 是否真存在此线性关系.Yx一 . 经验公式与最小二乘法:【例 1】 纤维的强度与拉伸倍数有关下表给出的是 24 个纤维样品的强度与拉伸倍数的实测记录我们

4、希望通过这张表能找出强度 y 与拉伸倍数 x 之间的关系式们将观察值 作为 24 个点,将它们画在平面上,这张,()(124)iixyi图称为散点图,这散点图启示我们,这些点虽然是散乱的,但大体上散布在一条直线的周围也就是说,拉伸倍数与强度之间大致成线性关系我们用()确定,是线性的,要完全确定经验公式,就要确定()中的系数 和 ,这里 通常称为ab回归系数,关系式3叫做回归方程 从散点图来看,要找出 与 是不困难的,在图上划一条直线,使该直线总的来看ab最“接近”这 24 个点于是,这直线在 y 轴上的截距就是所求的 ,它的斜率就是所a求的 几何方法虽然简单,但是太祖糙,而对非线性形式的问题,

5、就几乎无法实b行然而,它的基本思想,即“使该直线总的说来最接近这 24 个点” ,却是很可取的,问题是把这基本思想精确化,数量化下面介绍一种方法,求一条直线使其“总的来看最接近这 24 个点” ,这就是最小二乘法给定的 个点 ,那么,对于平面上任意一条直线n12(,)(,),()nxyxy: lab我们用数量 2()i iyx来刻画点 到直线 的远近程度, 于是二元函数(,)iixl 21(,)()niiiQabyabx就定量的描述了直线 跟这 个点的总的远近程度,这个量是随不同的直线而变化,或者l说是随不同的 与 而变化的,于是要找一条直线, 使得该直线总的来看最“接近” 这 nab个点的问

6、题就转化为:要找两个数 与 , 使得二元函数 在 处达到最小,(,)Qab,ab即 (,)min(,)ab由于 是 个量平方之和,所以“使 最小”的原则称为平方(,)Qabnab和最小原则,习惯上称为最小二乘原则由最小二乘原则求 与 估计值的方法称为最小二乘法按照最小二乘原则,具体求 的问题就是利用极值原理,求解二元一次联立,ab4方程组有唯一解:于是, 对于给定的 个点 ,先算出 ,再算出n12(,)(,),()nxyxy b,就得到了所求的回归方程:a可计算【例】的因此所求经验公式, 即回归方程为5【例 2】P236 例 1.2对任意两个相关变量,即使它们不存在线性关系,都可以通过它们的一

7、组观测值用最小二乘法,在形式上求得 和 的回归直线方程. 实际上,如果 和 没有线YXYX性相关关系,所求的回归直线方程是没有意义的因此建立了回归直线方程之后,还需要判断 与 间是否真有线性相关关系,这就是回归效果的检验问题称为回归效YX果的显著性检验 首先介绍“平方和分解公式” 二. 平方和分解公式与线性相关关系::对于任意的 组数据 , 恒有:n12(,),(,),(,)nxyxyxy+ 211()()ni iii iy21()(1)ii其中 i,(,)iabxn现记,yl21()niiy,21()niiU21()niiiQy则平方和分解公式是:(1)ylUQ证明:6因为 , , 并且ay

8、bx121()()()niiiniixy0 所以 ylUQ即 + 2211()()nni iii iy21()niiy是回归直线上,iyiabx其横坐标为 点的纵坐标,i7因为所以 的平均值也等于 1,y2,ny y我们还可以通过 的均值,进一步说明它们之间的关系,ylUQ8有了上面这些对于 的分析表明: ,ylUQ(1) 的离差平方和由两部分组成:(1,2,)iyn回归平方和 和残差平方和 , 其中 完全由随机因素引起,Q(2) 中虽然也有随机因素,但是当 时,主要是由 与 线性相关关系决U0bXY定因而 与 之比的比值反映了这种线性相关关系与随机因素对 的影响的大Q小比值越大,线性相关关系

9、越强大到什么程度才能说明有线性相关关系,还要进行检验,因而应寻找检验的统计量则 .,;xylbaybxU 2xbl,xyylQlU(参看 P.244+3, 注意: 这是常用的计算公式)三相关性检验:(1)提出原假设: :0Hb(2)选择统计量: /(2)UFQn(3)求出在假设 成立的条件下, , (1,2)Fn:(4)选择检验水平 ,查第一 自由度为 与第二 自由度为 .的,分布表(附表 4) ,得临界值 ,使得 F(),PF(5) 根据样本值计算统计量的观察值 ,给出拒绝或接受 H。的判断: 当 时,则拒绝 H。 ;当 时, 则接受 H。 F9如果 值相当大则表明 与 线性影响较大,就可以认为 与 间有线性相关关系;FXYXY反之,如果 值较小,则没有理由认为 与 间有线性相关关系XY衡量回归效果的好坏,除了采用回归问题的方差分析外, 还可以用统计量xyxylR来描述两个变量线性关系的密切程度,当 接近 , 与 之间的线性相关程度愈小,R0YX反之,当 接近愈大,愈接近 1, 与 之间的线性相关就愈为密切对一个具体问RYX题,只有当相关系数 的绝对值大到一定程度时才可用回归直线来近似地表示 与Y之间的关系.X对于假设 ,由 和 提供的两钟形式上不同的检验方法,实质上是一回事。HFR10(参看 P. 243 - P.244)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 策划方案

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。