1、 本科毕业论文 ( 20 届) 曲线拟合方法及其在实际问题中的应用 所在学院 专业班级 信息与计算科学 学生姓名 学号 指导教师 职称 完成日期 年 月 I 摘 要 回归分析是统计学中的重要统计方法之一 , 主要用来寻找并 推断具有相关关系的变量之间的数量关系式 , 有着广泛的应用领域和很高的实用价值 . 本文主要通过一个实例详细介绍了建立回归模型步骤 , 以及如何利用建立好的模型来进行预测 . 通过定性分析选取与财政收入有较强相关性的几个影响因素 , 利用 19942009年财政收入和其影响因素的数据 , 建立多元线性回归模型 , 并根据此模型预测出 2011年得财政收入 , 且结果与其他文
2、献中的数据相吻合 . 关键词 : 多元线性回归 ; 最小二乘 ; 财政收入预测 II Abstract Regression analysis is one of the important statistical methods of statistics, mainly using to find and infer a quantity equation between correlation variables, and it has a wide range of applications and high practical value. This thesis described
3、 in detail the steps to establish regression models, and it makes use of well-established model to predict by an example, by qualitatively analysing and selecting several factors which have a strong related with revenue, using the data of revenue and its influencing factors from 1994 to 2009 to esta
4、blish multiple linear regression model and to predict the revenue of 2011, and the results is consistent with the data in the other thesis. Keywords: Multiple linear regression; Least squares; Revenue projections III 目 录 摘要 .I Abstract . II 1 前言 . 1 2 多元回归分析 . 3 2.1 多元线性回归模型的建立 . 3 2.2 多元线性回归方程的检验 .
5、 4 2.3 利用多元线性回归方程进行预测 . 5 2.4 非线性回归分析 . 6 3 多元线性回归分析在实际问题中的应用 . 8 小结 . 13 参考文献 . 14 致谢 .错误 !未定义书签。 1 1 前言 在实际的工程应用 和经济应用领域中 , 人们往往只能测得一些分散的数据 , 为了从这些分散的数据点中找到规律 , 就需要利用这些分散的数据点 , 运用最小二乘法、多项式或其他的已知函数等方法来生成一个新的多项式或是新的函数来逼近这些已知点 , 回归分析就是从这些分散点之间的相 互关系出发 , 通过对与对象有联系的现象变动趋势的分析 , 进而推算出对象未来状态数量表现的一种方法 . 但是
6、 , 客观现象之间的联系是复杂的 , 许多现象的变动都涉及到多个变量之间的数量关系 . 这种研究某一因变量与多个自变量之间的相互关系的理论和方法就是多元线性回归法 . 回归分析在现实社会中应用及其广泛 , 农业 , 工业 , 医学 , 环境 , 特别是经济等领域都得到广泛的应用 . 2002 年禹学礼 , 陈洪军 , 艾华水等人在文献 1中通过四元回归分析 , 改进了以往体重与体积的估计关系式 , 得出黄牛体重与体高、体斜长、胸围 、管围有着密切的关系 . 2005 年徐东雨 , 李静在文献 2中 通过 Excel 工具和多元回归 , 分析大量医学实例数据 , 得到了人体中血糖的含量与胰岛素含
7、量和生长素含量的关系 . 2006 年王彬 , 李川 , 李兰等人在文献 3中根据对上海市 19952004 年度各年生活垃圾产生量及各主要影响因子的大量数据 , 通过回归分析 , 得出利用原始数据建立模型对未来城市垃圾产生量进行预测不能只考虑垃圾产生量单方面的因素 , 应该对各个相关因素都考虑在内且取相关性较大的因素建立模型 , 进而提出了控制和治理城市垃圾的方案从而能够达 到令人满意的效果 . 2007 年翟世杰 , 杜启花在文献 4中通过对以往投资与 GDP 或投资与财政收入之间的关系研究文献的改进 , 对 19952004 年度投资额与 GDP 和财政收入进行回归分析 , 得出投资与财
8、政收入 GDP 之间拟合模型 , 并根据此模型对 2009 年和 2010 年度投资额数据进行预测 . 并从预测的数据得出 , GDP、财政收入和投资都是随着时间而增加的 . 且这符合我国的现在的实际经济 , 投资逐步增长的基本现状 . 2005 年白萍在文献 5中通过建立影响我国财政收入的多元线性回归模型 , 并运用岭回归方法处理多 重共线性剔除对结果影响不大的因素 , 得出农业增加值每增 加 1亿元 财政收入会增加 0.134455 亿元 , 农业增加值每增加一个标准差 , 财政收入会增加 0.285922 个标准差 ; 第三产业生产总值每增加 1亿元 , 财政收入会增加 0.012617
9、 亿元 , 第三产业增加值每增加一个标准差 , 财政收入增加 0.188336个标准差的定量判断 . 并从中得出农业增加值对我国财政收入的影响相对最为显著 , 体现出了农业作为国民经济的基础产业的重要地位 . 第三产业增加值对我国财政收入的影响相对较弱 , 说明第三产业在我国发展还不充分 , 还有2 很大的发展空间 . 这对国家的经济发展有一定的指导作用 . 2010年毕瑞祥在文献 6中分析了财政收入预测经常用到的线性回归模型和自回归移动平均模 ARIM, 预测了平顶山市 2010 年到 2015 年的财政收入数据 . 2010 年崔志坤 , 朱秀变在文献 7中指出财政收入与经济发展水平、生产
10、技术水平、分配政策与制度、价格水平、产业结构等因素关系 , 通过财政收入与GDP 存在协整关系及财政收入与 GDP 存在正向关系的假设下 , 根据国民国经济发展的前景 , 运用简单的线性回归方程和 AR 模型 , 对我国近期和中长期 财政收入进行了预测 . 本文主要 介绍了多元线性回归模型的原理 , 建立过程 , 检验方法 , 以及在实际问题中的应用 , 并利用多元线性回归方程对我国财政收入进行了分析和预测 , 得出了财政收入与国民总收入 , 总人口 , 固定资产投资 , 就业人口 , 第一产业生产总值 , 第二产业生产总值几个因素的线性关系 , 并预测出了 2011 年我国的财政收入 . 3
11、 2 多元回归分析 2.1 多元线性回归模型的建立 假设随机变量 Y 与 p 个变量 12, , , px x x 有关 , 对于自变量 12, , , px x x 的一组确定的值 , Y 有它的分布 . 则 p 元线性回归模型为 20 1 1 2 2 + , ( 0 , )ppY x x x N . (2.1) 设有一组观测值 12( , , , ; ) ( 1 , 2 , , )i i ip ix x x y i n, 根据最小二乘原理 , 只要求使 20 1 0 1 11( , , . . . , ) ( . . . )np i i p p iiQ y x x , 达到最小的 01.
12、p 、 、 、 . 由于 Q 是 01. p 、 、 、 的一个非负二次型 , 故其最小值必存在 , 根据微积分的理论知道 , 只要求 Q 对 01. p 、 、 、 的一阶偏导为 0, 即 0 1 1 2 2100 1 1 2 212 ( . . . ) 01 , 2 , . . . ,2 ( . . . ) 0ni i i p p iini i i p p i ikikQ y x x xkpQy x x x x , 整理后可得关于 01. p 、 、 、 的一个线性方程组 0 1 11 1 121 0 1 1 1 11 1 1 120 1 11 1 1 1. . .n n ni ip p
13、ii i in n n ni i i ip p i ii i i in n n nip ip i ip p ip ii i i in x x yx x x x x yx x x x x y , (2.2) 称上 式为正规方程组 , 其解为 01. p 、 、 、 的最小二乘估计 , 为了方便 , 可用矩阵形式简洁地表示出来 . 令 1 1 1 01122 1 2 1111 ,1ppnn n pxx YYxxXYYxx , 4 因而用矩阵形式表示即为 X X X Y , 在回归分析中 , 通常 XX是非奇异的 , 即 1( )XX 存在 , 这时最小二乘估计 可以表示 为 1 ( ) X X X
14、 Y , (2.3) 即回归模型为 0 1 1 2 2 ppy x x x . (2.4) 当求得了 的最小二乘估计 后 , 就可建立回归方程 (2.1), 从而就可以利用它对指标进行预报和控制 . 2.2 多元线性回归方程的检验 检验是从统计意义上看参数估计量是否成立 , 而验证是探讨所拟定的模型是否与实际情况相符合 .我们对所得出的参 数估计量和数学模型 , 要进行检验和验证 . 模型的假设检验和参数的检验是十分重要 , 只有检验和验证通过后 , 方能进行进一步探讨分析 . 1. 回归方程的显著性检验 对回归方程的显著性检验 , 可以通过在多元线性回归模型基本假定条件下对统计假设检验来完成
15、 , 一般用运用 F 检验 , 即检验 0 1 2:0pH (2.5) 是否成立 . 多元线性回归方程显著性检验的 F 统计量 ( , 1 )( 1 )Re SpF F p n pS n p , 其中 21 ()nRiiS y y是回归平方和 ( y 为 12,ny y y 的平均值 ), 21 ()ne i iiS y y是残差平方和 , p 回归自由度 , 1np是残差自由度 . 对于给定的显著性水平 , 当检验统计量的观测值 ( , 1)F F p n p 时 , 拒绝原假设 , 即认为 Y 与 12, , , px x x 之间有线性关系 . 2. 回归系数的显著性检验 5 当 Y 与
16、 12, , , px x x 之间有线性关系 , 但是否每个变量都能起到显著性作用呢 ? 如果因子 ix 对 Y 的影响不显著 , 那么应近似有 0i , 因此要检验因子 ix 对 Y 是否有显著性影响 , 就相当于检验假设 0 : 0 ( 1, 2 , , )iiH i p , (2.6) 是否成立 使用统计量 2( 1)i iiecT S n p . 来检验统计量 i 是 否为零 , 即 ix 对 y 的影响是否显著 . 这里 iic 是矩阵 1XX 主对角线上第 i 个元素 . 对于给定的显著性水平 , 当 |iT 的观测值2| | ( 1)it t n p 时 , 拒绝假设 , 认为
17、 ix 对 Y 有显著影响 . 2.3 利用多元线性回归方程进行预测 当确定了回归方程后 , 就可以用点预测对于给定的一组自变量来预测因变量 0y , 但在实际问题中还需要知道预测精度 , 所以还需要给出预测区间 , 设 0y 是一个随机变量 . 则 2 * 1 * 0 0 0 0 ( 0 , (1 ( ) ) )y y N X X X X , 又已知 221 ( 1)eS n p , 00yy 与 eS 相互独立 . 于是 , 由 t 分布定义有 00* 1 * 00200* 1 * 001 ( )11 ( 1 )( 1 ( ) )1eeyyX X X XTSnpyyt n pSX X X
18、Xnp , 从而 , 对于给定的显著性水平 , 可以找到 ( 1)t n p 使得 6 * 1 *0 0 0 0 | | ( 1 ) ( 1 ( ) ) 11eSP y y t n p X X X Xnp . 若 令 * 1 * 0 0 0( ) ( 1 ) ( 1 ( ) )1eSy t n p X X X Xnp , 则有 0 0 0 0 0 ( ) ( ) 1P y y y y y . (2.7) 因此 , 对于给定的 01 02 0( , , , )px x x , 以 0y 作为 0y 的估计值 , 其误差限为 0()y , 可靠性为 1 ; 0y 的置信度为 1 的预测区间 0 0
19、 0 0 ( ), ( )y y y y . 这里不难看出用 0y估计 0y 其精度与残差平方和 eS 密切相关 , 因此 , eS 是回归预测精度的一个重要指标 . 2.4 非线性回归分析 前面主要介绍了多元线性回归 , 但 在有些实际问题中 , 变量之间关系是复杂的 , 即Y (因变量 )和 X (自变量 )的关系并不是线性的 , 这就需要运用非线性回归分析 . 非线性关系一般有三种类型 , 第一种类型是通过变量替换可换转成线性类型 . 第二种是自变量和因变量之间关系的函数形式不是很明确 , 这种需要运用多元逐步回归来求解 . 第三种是非线性问题 , 自变量和因变量之间的函数关系式是明确的
20、 , 但不能转换为线性类型 , 这就需要更为复杂的拟合方法来求解 . 一般情况下非线性回归模型可以表示为 ( , )Y f X , 式中 12 , , , pX x x x 为可观测的独立随机变量 (自变量 ), 12 , , , r 是待估的参数向量 , 12 , , , nY y y y 是独立观测变量 (因变量 ), 是随机误差 . 非线性回归模型主要有两种不同的解法 . 其中一个是最小二乘法 , 即求向量 Y 与集合( , )fX 的最短距离 21( ) ( ( , ) )niiiQ y f x, 假设 f 函数对参数 连续可微 , 利用微分法 ,将 Q 对参数 j 求偏导 , 且令其为 0, 得到 1p
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。