1、 大学毕业设计(论文)I数据拟合方法研究中文摘要在我们实际的实验和勘探中,都会产生大量的数据。为了解释这些数据或者根据这些数据做出预测、判断,给决策者提供重要的依据。需要对测量数据进行拟合,寻找一个反映数据变化规律的函数。本文介绍了几种常用的数据拟合方法,线性拟合、二次函数拟合、数据的 n 次多项式拟合等。并着重对曲线拟合进行了研究,介绍了线性与非线性模型的曲线拟合方法,最小二乘法、牛顿迭代法等。在传统的曲线拟合基础上,为了提高曲线拟合精度,本文还研究了多项式的摆动问题,从实践的角度分析了产生这些摆动及偏差的因素和特点,总结了在实践中减小这些偏差的处理方法。采用最小二乘法使变量转换后所得新变量
2、离均差平方和最小,并不一定能使原响应变量的离均差平方和最小,所以其模型的拟合精度仍有提高的空间。本文以残数法与最小二乘法相结合,采用非线性最小二乘法来得到拟合效果更好的曲线模型。随着计算机技术的发展,实验数据处理越来越方便。但也提出了新的课题,就是在选择数据处理方法时应该比以往更为慎重。因为稍有不慎,就会非常方便地根据正确的实验数据得出不确切的乃至错误的结论。所以提高拟合的准确度是非常有必要的关键词:数据拟合、最小二乘法、曲线拟合、多项式摆动、残数法大学毕业设计(论文)IIData Fitting MethodAbstractIn our experiments and exploration
3、, it will produce large amounts of data. In order to explain these data to make predictions based on these data to determine, provide an important basis for policy makers . Need to fit the measured data to find a function to reflect data changes in the law. This article describes several commonly us
4、ed data fitting methods, and focused on a nonlinear curve fitting of the model.This paper introduces some commonly used data fitting method, linear fitting, secondary function fitting, data n times polynomial fitting etc. T And focuses on the curve fitting, introduced the linear and nonlinear model
5、of curve fitting method, the least square method, Newton iterative method, etc. In the traditional curve fitting basis, in order to improve the curve fitting precision, this paper also studies the polynomial swing, from the perspective of the practice the oscillation and deviation of factors and cha
6、racteristics, and summarizes the decrease in practice the treatment method of these deviations. The least square method to variable after converting from new variables are the sum of squared residuals minimum, not necessarily make the original response from all the variables of the sum of squared re
7、siduals minimum, so the model fitting precision still has room to improve. Based on the number of residual method and least square method, and the combination of nonlinear least square method to get better fitting effect of curve model. With the development of computer technology, the experiment 大学毕
8、业设计(论文)IIIdata processing more and more convenient. But also put forward the new subject, which is in the data processing method of choice should be more careful than ever before. Because carelessly a bit, it can be very easily according to the correct experimental data that not the exact and even t
9、he wrong conclusion. Therefore, to raise the fitting accuracy is very necessaryKey words: Data Fitting ; Least square method; Curve fitting; Polynomial swing; Residual method大学毕业设计(论文)IV目 录中文摘要 IAbstract II第一章 绪论 111 数据简介 11.1.1 名词解释 11.1.2 数据属性 11.2 曲线拟合简介 2第二章 数据拟合方法分类 32.1 线性拟合 42.2 二次函数拟合 62.3 数
10、据的 n 次多项式拟合 82.4 点集x 1,x 2,x m上的正交多项式系 92.5 用正交多项式系组成拟合函数的多项式拟合 102.6 指数函数的数据拟合 112.7 多元线性函数的数据拟合 12第三章 曲线拟合特性 143.1 线性模型的曲线拟合 143.1.1 最小二乘法及其计算 143.1.2 用正交多项式作最小二乘拟合 203.2 非线性模型的曲线拟合 233.2.1 牛顿迭代 233.2.2 常见非线性模型 24第四章 多项式的摆动 294.1 多项式摆动介绍 294.2 影响多项式拟合偏差的因素 324.2.1 实验数据的不均匀性 324.2.2 数据的密度 33大学毕业设计(
11、论文)V4.2.3 拟合曲线的适用区间 334.3 使用多项式拟合的注意事项 334.3.1 尽量避免高阶多项式的拟合 334.3.2 保持密度 344.3.3 在实验数据走向比较明确的前提下,可以考虑其他的非线性拟合方法 34第五章 残数法与最小二乘法结合 365.1 二项指数曲线原理与方法 365.2 资料与分析 395.3 残数法与最小二乘法结合总结 42第六章 总结 44结束语 44参考文献 47附录 1 英文原文 51附录 2 中文翻译 65附录 3 程序 78大学毕业设计(论文) 第 1 页第一章 绪论在我们实际的实验和勘探中,都会产生大量的数据。为了解释这些数据或者根据这些数据做
12、出预测、判断,给决策者提供重要的依据。需要对测量数据进行拟合,寻找一个反映数据变化规律的函数。11 数据简介科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等的数值。1.1.1 名词解释研究数据就是对数据进行采集、分类、录入、储存、统计分析,统计检验等一系列活动的统称。1.1.2 数据属性柯岩奇异的书简船长:“ 贝汉廷 分析着各个不同的数据,寻找着规律,终于抓住了矛盾的牛鼻子。 ” 数据是载荷或记录信息的按一定规则排列组合的物理符号。可以是数字、文字、图像,也可以是计算机代码。对信息的接收始于对数据的接收,对信息的获取只能通过对数据背景的解读。数据背景是接收者针对特定数据的信
13、息准备,即当接收者了解物理符号序列的规律,并知道每个符号和符号组合的指向性目标或含义时,便可以获得一组数据所载荷的信息。亦即数据转化为信息,可以用公式“数据+背景=信息”表示。数据拟合在很多地方都有应用,主要用来处理实验或观测的原始离散数据。通过拟合可以更好的分析和解释数据。大学毕业设计(论文) 第 2 页1.2 曲线拟合简介曲线拟合,俗称拉曲线,是一种把现有数据透过数学方法来代入一条数式的表示方式。科学和工程问题可以通过诸如采样、实验等方法获得若干离散的数据,根据这些数据,我们往往希望得到一个连续的函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合,这过程就叫做拟合。在科学实验或社会活
14、动中,人们常常需要观测很多数据的规律, 通过实验或者观测得到量 x 与 y 的一组数据对( )(i=1,2, ,N),其,中 是彼此不同的。人们希望用一类与数据本质规律相适应的解析表达式, 来反映量 x 与 y 之间的依赖关系,即在一定意义下 “最佳”=( ,)地逼近或拟合已知数据。 常称作拟合模型,当 c 在 中线性出现时,( ,) 称为线性模型,否者称为非线性模型。线性模型是回归模型中最常见的一种,但在实际中,许多现象之间的关系往往并不是线性的,而是呈现某种曲线关系。如服药后血药浓度与时间的关系;病毒剂量与致死率的关系;化学反应的反应物浓度与反应速度的关系。这就产生的曲线拟合,用连续曲线近
15、似地刻画或比拟平面上离散点组所表示的坐标之间的函数关系。用解析表达式逼近离散数据的一种方法。大学毕业设计(论文) 第 3 页第二章 数据拟合方法分类在实验中,实验和戡测常常会产生大量的数据。为了解释这些数据或者根据这些数据做出预测、判断,给决策者提供重要的依据。需要对测量数据进行拟合,寻找一个反映数据变化规律的函数。数据拟合方法与数据插值方法不同,它所处理的数据量大而且不能保证每一个数据没有误差,所以要求一个函数严格通过每一个数据点是不合理的。数据拟合方法求拟合函数,插值方法求插值函数。这两类函数最大的不同之处是,对拟合函数不要求它通过所给的数据点,而插值函数则必须通过每一个数据点。例如,在某
16、化学反应中,测得生成物的质量浓度 y (10 3 g/cm3)与时间 t (min)的关系如表所示t 1 2 3 4 6 8 10 12 14 16y 4.00 6.41 8.01 8.79 9.53 9.86 10.3310.4210.5310.61显然,连续函数关系y(t)是客观存在的。但是通过表中的数据不可能确切地得到这种关系。何况,由于仪器和环境的影响,测量数据难免有误差。因此只能寻求一个近拟表达式y = (t)寻求合理的近拟表达式,以反映数据变化的规律,这种方法就是数据拟0 2 6 8 45689 大学毕业设计(论文) 第 4 页合方法。数据拟合需要解决两个问题:第一,选择什么类型的
17、函数作为拟合函数(数学模型) ;第二,对于选定的拟合函数,如何确定)(t拟合函数中的参数。数学模型应建立在合理假设的基础上,假设的合理性首先体现在选择某种类型的拟合函数使之符合数据变化的趋势(总体的变化规律) 。拟合函数的选择比较灵活,可以选择线性函数、多项式函数、指数函数、三角函数或其它函数,这应根据数据分布的趋势作出选择。为了问题叙述的方便,将例 1 的数据表写成一般的形式t x1 x2 x3 x4 x5 x6 x7 x8 x9 x10y y1 y2 y3 y4 y5 y6 y7 y8 y9 y102.1 线性拟合假设拟合函数是线性函数,即拟合函数的图形是一条平面上的直线。而表中的数据点未
18、能精确地落在一条直线上的原因是实验数据的误差。则下一步是确定函数y= a + b x中系数 a 和 b 各等于多少?从几何背景来考虑,就是要以 a 和 b 作为待定系数,确定一条平面直线使得表中数据所对应的 10 个点尽可能地靠近这条直线。一般来讲,数据点将不会全部落在这条直线上,如果第 k 个点的数据恰好落在这条直线上,则这个点的坐标满足直线的方程,即a + b xk = y k如果这个点不在直线上,则它的坐标不满足直线方程,有一个绝对值为大学毕业设计(论文) 第 5 页的差异(残差) 。于是全部点处的总误差是kybxa10kkybxa这是关于 a 和 b 的一个二元函数,合理的做法是选取 a 和 b ,使得这个函数取极小值。但是在实际求解问题时为了操作上的方便,常常是求 a和 b 使得函数 102)(),(kkybxaF达到极小。为了求该函数的极小值点,令, ,0ab得, 0)(210kkybx10)(2kkkxya这是关于未知数 a 和 b 的线性方程组。它们被称为法方程,又可以写成 1010210kkkkkyxbax