1、本 科 毕 业 论 文题 目 名 称 : 数 学 建 模 中 的 回 归 分 析 法 学 院 : 数 学 与 统 计 学 院 专 业 年 级 : 数 学 与 应 用 数 学 2009 级 ( 精 算 与 风 险 管 理 ) 学 生 姓 名 : 李 雨 函 班 级 学 号 : 200911030139 指 导 教 师 : 王 艺 霏 二 O 一三年五月二十四日 摘我们要现实生活中, 由于客观事物内部规律的复杂性及人们认识程度的限制, 人们常搜集大量的数据, 基于数据的统计分析建立合乎机理规律的数学模型, 然后通过计算得到的模型结果来解释实际问题. 回归分析法是数学模型中常用解决问题的有效方法.
2、它是研究某个变量关于另一些变量的具体依赖关系的计算方法. 主要内容是从一组样本数据出发, 确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验, 并从影响某一特定变量的诸多变量中找出哪些变量的影响显著, 哪些不显著. 利用所求的关系式, 根据一个或几个变量的取值来预测或控制另一个特定变量的取值, 并给出这种预测或控制的精确程度. 本文介绍线性回归模型和非线性回归模型的概念、基本原理和应用步骤, 并最后通过实例分析介绍从数据出发建立、检验回归模型的步骤和模型结果中具体每个符号的实际意义. 结果表明, 在实际生活各个领域, 回归分析是很好的预测分析方法.关键字: 回归分析; 线性回归模型
3、; 非线性回归模型IAbstractIn real life, the complexity of the internal law of things and awareness of the limits, people collected a large amount of data and based on the statistical analysis of data to set up mechanism model, and then through the calculated model results to explain the practical problems.
4、Regression analysis is commonly used in mathematical model is the effective method to solve the problem. It is the study of one variable on other variables depend on the specific calculation method. The main content from a set of sample data, determine the mathematical relationship between the varia
5、bles of the relation between the credible degree of various statistical tests, and from the influence of a particular variable variables to find out the influence of which variables significantly, which was not significant. The use of petitions, according to the value of one or several variables to
6、predict or control the other of a particular variable values, and give the accurate predict or control. This paper introduces the concept of the linear regression model and nonlinear regression model, basic principle and application steps, and finally through the instance analysis is introduced from
7、 data set up, testing procedure and model of the regression model results in the practical significance of the specific each symbol. The results show that the regression analysis is a good way to forecast analysis. Keyword: Regression Analysis; Linear Regression Model; Nonlinear Regression ModelII目
8、录中文摘要 英文摘要 目 录 1.引 言 12. 回归模型的建立 22.1 回归分析模型一般形式 32.2 多元线形回归的模型 32.2.1 多元线形回归的模型 32.2.2 多元线形回归的假设 32.2.3 多元线形回归的求解 32.2.4 多元线形回归的检验 42.3 曲线回归模型 52.3.1 可化成线形回归的曲线回归 52.3.2 不可转化的非线性回归模型 63. 回归分析模型的实际应用 6致 谢 11参考文献 1201.引 言当需要从定量的角度分析和研究一个实际问题时, 人们就要在深入调查研究、了解对象信息、做出简化假设、分析内在规律等工作的基础上, 用数学的符号和语言, 把它表述为
9、数学式子, 也就是数学模型, 然后通过计算得到的模型结果来解释实际问题, 并接受实际的检验 1. 1983 年,数学建模作为一门独立的课程进入我国高等学校, 20 多年来, 数学建模工作发展的非常快, 许多高校相继开设了数学建模课程, 我国 1992 年国家教委高教司提出在全国普通高等学校开展数学建模竞赛, 旨在”培养学生解决实际问题的能力和创新精神, 全面提高学生的综合素质 ”. 近年来, 数学模型和数学建模这两个术语使用的频率越来越高, 而数学模型和数学建模也被广泛地应用于其他学科和社会的各个领域. 在数学建模中常用的方法有很多种,本文主要介绍最常用的有效方法回归分析法. 回归分析方法是统
10、计分析的重要组成部分 , 回归分析的主要内容, 一是从一组数据出发, 确定这些变量间的回归模型; 二是对模型的可信度进行统计检验; 三是从有关的许多变量中, 判断变量的显著性(即哪些是显著的, 哪些不是, 显著的保留 , 不显著的忽略 ); 四是应用结果是对实际问题作出的判断. 根据回归模型中回归的特征, 常见的回归模型有: 一元线性回归模型、多元线性回归模型、非线性回归模型.近年来国内外学者应用回归分析法解决了实际中一系列问题. 周新宇, 孙凡雷在因素回归分析法在不良债权价值分析中的应用中对小金额债权采用相关因素回归分析法进行价值分析可以较好地解决金额小且户数众多的资产价值分析. 马瑞民,
11、姚立飞在回归分析在数学建模中的应用 -基于上海世博会参观人数的预测分析模型中对参加世博会参观人数进行预测, 与实际相差很小.澳大利亚学者 Salina Hishama, Che Rozid Mamat 等人在马来西亚华人脚部身高测量人体形态学的回归分析中给出利用人脚的尺寸预测身高的回归模型 2.为了更好的指导回归分析在实际中的应用, 本文主要讨论回归分析法的分类和各种建模及其应用. 12.回归模型的建立2.1 回归分析问题的一般形式 设有 个自变量 和 1 个因变量 ,它们之间有下列关系ppx,21 y.);,(22pPaFy其中 是函数形式已知的 元函数, 是常数, 是函数 中的未知参Fa,
12、1 F数, 是表示误差的随机变量, 一般可认为 , . )0(2N对 , 进行 次观测, 得到观测值Px,21 yn, .)(21iPiiyx n,21对每一次观测来说, 同样有下列关系,ipimii aFy ),;,(2121其中 是第 次观测时的随机误差.),21(ni回归分析目标是从观测数据出发, 求出 的估计 , p,21 pa,21使得下列平方和 达到最小 .Q.ni pmiii axFy1 22121 ),;,( 由于估计的目标是使一个平方和达到最小, 而平方又称为 “二乘”, 所以, 这种估计称为最小二乘估计(LSE), 求这种估计的方法称为最小二乘法 3.把 代入 表达式,就得
13、到 的最小值pa,21 QQ.ni pmiii axFy1 22121mi ),;,( 的最小值称为残差平方和, 残差平方和越小, 说明回归方程表达变量之间Q统计相关关系的精确程度越高, 也就是回归分析的效果越好.2【】 2.2 线形回归模型的建立2.2.1 多元线形回归的一般形式设随机变量 y 与一般变量 的线性回归模型为px21,px0其中, 是 个未知参数, 称为回归常数,p ,210 0称为回归系数. 参数 称为随机误差; 称为被解释变量(因变量), p ,210 y, 是 个可以精确测量并控制的一般变量,称为解释变量 (自变量). xx时 , 该回归模型为一元线性回归模型; 当 时,
14、 就称该式为多元线性回p 2p归模型.2.2.2 多元线性回归模型的基本假设(1) 解释变量 , 是确定性变量, 不是随机变量 , 且要求1xp 2, 并要求样本量的个数应大于解释变量的个数.npXrank)(2) 随机误差项 具有零均值和等方差, 即 niEi ,21,0)(3) 对于自变量 的所有值, 的方差 都相同px21 2(4) 误差项 是一个服从正态分布的随机变量, 即 且相互独立. ),(2N2.2.3 多元线性回归参数的求解对 , 进行 次观测 , 得到一组观测值px,21 yn, .),(21ipiiyx n,21即有, , .ipiii xxy10 )0(2Ni,线性回归的
15、目标是: 从自变量和因变量的观测数据出发 , 求未知参数 的估计值 , 使得平方和 达到最小p,10 p,10 Q3.ni pimii xxyQ1 210)(是 的函数, 所以这是一个多元函数求最小值的问题, 我们可p,10以通过求偏导数、解下列方程组的方法, 来确定 的最小值点Q.001pQ从这个方程组中求得的解 , 使 达到最小, 是 ,10 p,10的最小二乘估计.(有时, 线性回归问题中可能会不出现常数项 , 也可以类似地求解).当自变量个数 比较多时,线性回归的具体计算是很烦琐复杂的, 且人工计n算工作量很大. 我们在解决实际问题时, 可以利用这些现成软件如 SPSS 软件, 十分方
16、便迅速地完成线性回归的计算.2.2.4 线性回归方程显著性检验 4(1) 提出假设: 线性关系不显著 .0H0.21p: 至少有一个不等于 0. ,(2) 计算检验统计量 F.)1,()1()1(21 pnFpnyknSERniiii(3) 确定显著性水平 . 和分子自由度 、分母自由度 , 找出临kk界值 .F4(4) 做出决策 . 若 ,拒绝 .F0H2.3 非线性回归在许多实际问题中变量之间的关系并不都是线性的. 通常我们遇到某些现象的因变量和自变量之间曲线关系, 就不能再搬抄线性回归的建模方法. 对于可以通过数学方法把非线性回归化成线性回归的, 就按照回归方法建模; 对于不能转化的,
17、讨论其模型的参数估计方法和建模过程.2.3.1可转化线性回归的曲线回归实际中, 许多回归模型的因变量和自变量之间都不是线性的, 其中一些回归模型通过对自变量函数变换可以转化为线性关系, 利用线性回归求解未知参数,并作回归诊断, 如下列模型(1)bxey10(2)px.2(3)eaybx对于(1)只须令 即可化为 对 是线性的形式xy.x10对于(2), 只须令 , , , 于是得到 关于 的x12pypx .,21线性表达式.pxy.210对于(3), 等式两边同时取自然对数得.ba1ln令 得到10,ln,bay.xy10现在对于曲线回归模型求解一般使用软件, 如SPSS19.0中的常见可线性化