1、灰色预测理论,胡亚飞 彭 敬 李云飞吕连磊 苗成林 沈 聪,目录,灰色系统理论简介以及发展灰色预测理论 灰色预测简介 灰色预测类型 灰色预测模型 灰色预测检验案例以及软件实现,灰色系统理论简介,灰色系统理论是由我国著名学者邓聚龙教授于1982年创立的“以部分信息已知,部分信息未知的小样本、贫信息”不确定系统为研究对象的一门系统科学新学科,具有原创性的科学意义,是我国对系统科学的新贡献,目前已受到国内外学术界的广泛重视,并在农业科学、经济管理、环境科学、医药卫生、矿业工程、教育科学、水利水电、图像信息、生命科学、控制科学、航空航天等众多领域中得到了广泛的应用,解决了许多过去难以解决的实际问题。,
2、灰色系统理论的内容,灰色系统理论经过20多年的发展,已基本建立起一门新兴学科的结构体系。其主要内容包括以灰色朦胧集为基础的理论体系,以灰色关联空间为依托的分析体系,以灰色序列生成为基础的方法体系,以灰色模型(GM )为核心的模型体系,以系统分析、评估、建模、预测、决策、控制、优化为主体的技术体系。,灰色朦胧集、灰色代数系统、灰色方程、灰色矩阵等是灰色系统理论的基础,从学科体系自身的优美、完善出发,这里有许多问题值得进一步研究。灰色系统分析除灰色关联分析外,还包括灰色聚类和灰色统计评估等内容。灰色序列生成通过序列算子的作用来实现,序列算子主要包括缓冲算子(弱化算子、强化算子)、均值生成算子、级比
3、生成算子、累加生成算子和累减生成算子等。灰色模型按照五步建模思想构建,通过灰色生成或序列算子的作用弱化随机性,挖掘潜在规律,经过灰色差分方程与灰色微分方程之间的互换实现了利用离散的数据序列建立连续的动态微分方程的新飞跃。灰色预测是基于GM 模型作出的定量预测,按照其功能和特征可分为数列预测、区间预测、灾变预测、季节灾变预测、波形预测和系统预测等几种类型。灰色决策包括灰靶决策、灰色关联决策、灰色统计、聚类决策、灰色局势决策和灰色层次决策等。灰色控制的主要内容包括本征性灰色系统的控制问题和以灰色系统方法为基础构成的控制,如灰色关联控制和GM (1,1)预测控制等。灰色优化技术包括灰色线性规划、灰色
4、非线性规划、灰色整数规划和灰色动态规划等。,灰色系统理论的内容,基础知识,1.灰色系统是指“部分信息已知,部分信息未知”的“小样本”,“贫信息”的不确定性系统。 信息不完全包含: 1、系统因素不完全明确; 2、因素关系不完全清楚; 3、系统结构不完全知道; 4、系统作用原理不完全明了。2.白色系统、灰色系统、黑色系统 白色系统:一个系统的内部特征是完全已知的,即系统的信息是完全 充分的。如:存取款系统,存款金额明确,利息固定则最终取款金额就已知。 灰色系统:一个系统的内部特征是不完全已知的系统。人体是一个系统,人的身高、体温、血压等都是已知的,可是,人体内部在结构及部位功能上还有许多问题尚未可
5、知。 黑色系统:一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究。如:观测到的星体。,灰色系统分析法、数理统计法及模糊法对比,灰色预测,灰色预测是对既含有已知信息又含有不确定信息的系统进行预测,就是对在一定范围内变化的、与时间有关的灰色过程进行预测。通过对原始数据的生成处理来和灰色模型的建立,挖掘、发现、掌握寻求系统变动的规律。生成数据序列有较强的规律性,可以用它来建立相应的微分方程模型,从而预测事物未来的发展趋势和未来状态,对系统的未来状态做出科学的定量分析。,常用的灰色预测有五种,(1)数列预测,即用观察到的反映预测对象特征的时间序列来构造灰色预测模型,预测未
6、来某一时刻的特征量,或达到某一特征量的时间。(2)灾变与异常值预测,即通过灰色模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。(3)季节灾变与异常值预测,即通过灰色模型预测灾变值发生在一年内某个特定的时区或季节的灾变预测。(4)拓扑预测,将原始数据作曲线,在曲线上按定值寻找该定值发生的所有时点,并以该定值为框架构成时点数列,然后建立模型预测该定值所发生的时点。(5)系统预测,通过对系统行为特征指标建立一组相互关联的灰色预测模型,预测系统中众多变量间的相互协调关系的变化。,预测模型,单序列灰色预测模型GM(1,1)模型DGM(1,1)模型GM(1,N)模型Verhulst模型区间灰
7、数预测模型基于几何坐标法的区间灰数预测模型IGPM-G(1,1)基于信息分解法的区间灰数预测模型IGPM-P(1,1)基于灰色属性法的区间灰数预测模型IGPM-D(1,1),单序列灰色预测模型,灰色系统理论认为:系统的行为现象尽管朦胧,数据尽管复杂,但它必然是有序的,都存在着某种内在规律。不过这些规律被纷繁复杂的现象所掩盖,人们很难直接从原始数据中找到某种内在的规律.灰色生成:建立灰色模型之前,需要对原始时间序列按照某种要求进行预处理,得到有规律的时间序列数据生成列。即对原始数据的生成就是企图从杂乱无章的现象中去发现内在规律.常用的灰色系统生成方式有: 累加生成,累减生成,均值生成,级比生成等
8、,下面对这几种生成做简单介绍:,1.累加生成 通过数列间时刻各数据的依个累加以得到新的数据与数列,累加所得的新数列叫做累加生成数列。 具体地,记原始数列为 X(0)=(x(0)(1), x(0)(2),x(1)(n) 累加生成序列 X(i)=(x(i)(1), x(i)(2),x(i)(n) 一次累加生成关系 累加生成的作用:通过累加生成可以看出灰量积累过程的发展态势,使离乱的原始数据中蕴含的积分特性或规律加以显化。 2.累减生成 对数列求相邻两数值的差,是累加生成的逆运算。 记原始序列为 X(1)=(x(1)(1), x(1)(2),),x(1)(n) 一次累减生成序列为 X(0)=(x(0
9、)(1), x(0)(2),x(0)(n) 其中,x(0)(k)=x(1)(k)-x(1)(k-1) 累减生成的作用 累减生成可将累加生成还原为非生成数列,在建模方 程用来获得增量信息。,3.均值生成 设原始序列为 X(0)=x(0)(1), x(0)(2),x(0)(n) ,x(0)(k-1)与x(0)(k)为数列X(0)的一对(紧)邻值,则称x(0)(k-1)为值,x(0)(k)称为后值。 对于常数(0,1) 则称 z(0)(k)=x(0)(k) + (1-)x(0)(k 1) 为由数列x(0)的邻值在生成系数(权)下的邻值生成数。 特别地,当生成系数为0.5时,则称z(0)(k) = 0
10、.5x(0)(k) + 0.5x(0)(k 1) 为(紧)邻均值生成数,即等权邻值生成数。4.级比生成 级比生成是一种常用的填补序列端点空穴的方法。对数列端点值的生成,我们无法采用均值生成填补空缺,只能采用级比生成。 级别生成在建模中可以获得较好的灰指数律。级比生成是级比(k)与光滑比(k)生成的总称。 设原始序列为 X(0)=x(0)(1), x(0)(2),x(0)(n),称 (k)为级比,(k)为光滑比,其表达式为 (k)=x(0)(k)/x(0)(k 1) (k)=x(0)(k)/x(1)(k-1),GM(1.1)模型,模型符号含义GM(1,1) Grey Model(1阶方程,1个变
11、量)GM(1,1)建模过程 令X(0)为GM(1,1)为原始建模序列:X(0)=(x(0)(1), x(0)(2),x(0)(n)其中x(0)(k)0,k=1,2,.,n X(1) 为X(0)累加生成序列X(1)=(x(1)(1), x(1)(2),x(1)(n) 令Z(1)为X(1)的紧邻均值生成序列Z(1)=( z(1)(1 ), z(1)(2), z(1)(k ))z(1)(k)=o.5 x(1)(k)+0.5 x(1)(k-1) GM(1,1)的灰微分方程模型为x(0)(k+1)+a z(1)(k)=b 式中称为-a发展系数,b为灰色作用量,准备知识一阶微分方程模型 dx/dt+ax=
12、b导数的定义 当t很小并取很小的单位1时x(t+1)-x(t)=x/t则离散形式可写为x/t=x(1)(k+1)-x(1)(k)=x(0)(k+1)由dx/dtx/tx(1)(k+1)-x(1)(k),在x(1)(k),x(1)(k+1)范围内,由于很短时间内背景值(即x值)不会发生突变,则取均值 z(1)(k+1)=o.5 x(1)(k)+0.5 x(1)(k+1)作为x的值。则得到灰微分方程为x(0)(k+1)+a z(1)(k)=b则可得矩阵方程x(0)(k+1)=-a z(1)(k)+bYn=B&,设&为待估参数向量,即&=(a,b)T,则灰微分方程的最小二乘估计参数列满足&= 其中,
13、 B= Y n= 则称 为灰色微分方程x(0)(k)+az(1)(k)=b的白化方程,也叫影子方程。 将上面所求参数代入白化方程,求得其解为 还原到原始数据,DGM(1,1)模型,DGM(1,1)模型和GM(1,1)是完全等价的。DGM(1,1)模型全面符合灰色预测模型的建模机理.是一种新的灰色预测模型.或者说是灰色预测模型的一种新形式。其中DGM(1,1)模型更能够精确模拟齐次指数序列。对于非指数增长序列和震荡序列,应选择微分,差分混合形态的GM(1,1);对于接近齐次指数序列的非指数增长序列和震荡序列,应优先选择DGM(1,1)模型。DGM模型可以看做是GM模型的精确形式,当GM模型中的a
14、取值很小时,二者可替换。,GM(1,1)和DGM(1,1)的关系,GM(1,N)模型,如果考虑的系统由若干个相互影响的因素组成,设 为系统特征数据序列,而,. .,为相关因素序列。 为 的1-AGO序列 , 为 的紧邻生成序列,则称,为GM(1,N)灰色微分方程。,定义,为GM(1,N)灰色微分方程的参数列,根据最小二乘法可以得出:,式中,为GM(1,N)灰色微分方程(2)的白化方程,也称影子方程。,于是,我们有1)白化方程(3)的解为,2)当 变化幅度很小时,可视 为灰常量,这样,GM(1,N)灰色微分方程(3)的近似时间响应式为,其中 取为 。,3)累减还原式为,(5),(4),灰色Ver
15、hulst模型,灰色系统理论自1982年诞生以来,它被广泛应用于农业生产、经济、管理和工程技术等领域。灰色预测理论是灰色系统理论的主要内容之一,而GM(1,1)模型又是灰色预测理论中最核心的模型。而对于具有s型序列,则不适宜用GM(1,1)模型预测,适合用灰色Verhulst模型等进行预测。灰色Verhulst模型避免了传统的Verhulst模型建模的大样本要求,因此,该模型得到了较广泛的使用。Verhulst模型主要用来描述具有饱和状态的过程,即S形过程,常用于人口预测,生物生长,繁殖预测和产品经济寿命预测等.由Verhulst方程的解可以看出,当t时,若a0,则x(1)(t) 0;若at,
16、 x(1)(k+1) 与x(1)(k) 充分接近,此时x(0)(k+1) 0 ,系统趋于死亡.,设X(0)为原始数据序列, X(1)为X(0)的1-AGO序列, Z(1)为X(1)的紧邻均值生成序列,则称为GM(1,1)幂模型. 称为GM(1,1)幂模型的白化方程.GM(1,1)幂模型之白化方程的解为,Verhulst模型,设 ,有则GM(1,1)幂模型参数列 的最小二乘估计为,当a=2时,称为灰色Verhulst模型.称 为灰色Verhulst模型的白化过程.,Verhulst白化方程的解为灰色Verhulst模型的时间响应式为,区间灰数预测模型,区间灰数:定义 既有下界 ,又有上界 的灰数
17、称为区间灰数,记为 ,其中 。白化权函数:是用来描述一个区间灰数 在其取值范围 内对不同数值的“偏爱”程度的函数,称为 的白化权函数。区间灰数的“核”和“灰度”是区间灰数的两个重要属性,是研究区间灰数代数运算法则以及建立区间灰数预测模型误差检验方法的基础。区间灰数的“核”,是在充分考虑已知信息的条件下,最有可能代表区间灰数“白化值”的实数;区间灰数的“灰度”,反映了人们对灰色系统认识的不确定程度。我们通常的实数则是灰度为零且核为本身的特殊区间灰数。,区间灰数序列的白化方法,区间灰数序列: 其中 。根据区间灰数序列的几何特点,信息特征以及灰色属性,通常将区间灰数序列的白化方法分为几何坐标法,信息
18、分解法以及灰色属性法三类,将区间灰数序列转化为相关的实数序列。,附图-基于几何坐标法的区间灰数序列白化方法,注释基于灰色属性法的区间灰数序列白化方法,其中所有区间灰数产生的背景或论域为 ,也就是区间灰数的最大边界,为已知。且 在其范围内的取值可能性均等,即区间灰数 的白化权函数为矩形。,基于几何坐标法的区间灰数预测模型IGPM-G(1,1) 即分别构建基于面积序列和坐标序列的DGM(1,1)模型,并在此基础上通过几何坐标法的反向推导,实现对区间灰数上界及下届的模拟,进而实现区间灰数预测模型的构建。 具体模型建立参照前边的DGM(1,1)模型,可以得到面积序列和坐标序列的的预测模型, 从而得到,
19、解方程组,可得到区间灰数 上界和下界的模拟及预测公式, 其中,基于信息分解法的区间灰数预测模型IGPM-P(1,1) 即分别构建基于实部(也称“白部”)序列和灰部序列的DGM(1,1)模型,并在此基础上通过推导区间灰数上界及下界的模拟表达式,实现区间灰数预测模型的构建。 具体模型建立参照前边的DGM(1,1)模型,可以得到白部序列和序列的的预测模型,,基于灰色属性法的区间灰数预测模型IGPM-D(1,1) 即通过“核”序列为基础建立DGM(1,1)预测模型,实现对未来区间灰数“核”的预测;然后以“灰度不减公理”为理论依据,以“核”为中心拖展得区间灰数的上界和下界,在不破坏区间灰数独立性和完整性
20、的前提下,实现区间灰 数的模拟和预测。核序列具体模型建立参照前边的DGM(1,1)模型,可以得到核序列的预测模型, 灰度不减原理:两个灰度不同的区间灰数进行和,差,积,商运算时,运算结果的灰度不小于灰数较大的区间灰数的灰度,即,可得,单序列预测模型检验,灰色模型是灰色系统理论的重要组成部分,在各个领域的广泛应用说明:灰色理论具有很多独特的优越性。灰色模型应用的广泛,其精度成为了一个很受关注的问题。 灰色模型的误差a.抽样误差或试验误差它是原始数据记录或统计过程中出现的误差b.舍入误差或计算误差它是建模计算过程中由于运算数据的舍入引起的误差C.模型表达误差由于灰色系统以“近似地”表达为描述问题和
21、就决问题的指导思想,所以原始数据和模拟值之间就必然存在微小的差距 。,误差分析 前两种误差带有一定的客观性和必然性,是模型不可避免的误差;后一种误差可以通过不断的改进使模型的误差逐渐降低。 由于人们用精准性理论建立符合复杂事物发展规律的模型几乎是不可能的,因此建立背景值为灰的近似模型也就不可避免地出现微小误差,但是这种很小的误差并不影响人们利用灰模型研究事物发展的内在规律,并以此指导生产实践,只有当模型误差超出了一定的限制范围时,模型的实用性才会降低。,1.1.1 相对误差检验法,(1-1),(1-2),1.1.2 后验差检验法,表21 精度检验等级参照表,1.1.3 关联度检验法,关联度检验
22、,即通过考察模型值曲线和建模序列曲线的相似程度进行检验,是一种几何检验。关联度计算方法,先计算出 与 原始序列的关联系数,然后算出关联度,根据经验,关联度大于0.6便是满意的。,如果 在所有关联度中最大,则第i种灰色建模方法为所建模型中最好的模型。,设,,则关联系数定义为:,式中:,为第k个点,与,的绝对误差;,为两级最小差;,为两级最大差;,称为分辨率,01,一般取=0.5;对单位不一,初值不同的序列,在计算相关系数前应首先进行初始化,即将该序列所有数据分别除以第一个数据。,关联度: 称为 与 的关联度,区间灰数预测模型误差检验方法,平均相对模拟误差检验,软件演示案例 GM(1,1)模型,1
23、. 已知某公司1999-2008年的利润(元/年)为89677,99215,109655,120333,135823,159878,209407,246619,300670要求:对该公司未来几年的利润情况进行预测.步骤:(1)对原始数据进行累加,进行紧邻均值生成;(2)构造累加矩阵B与常数向量;(3)求解GM(1,1)模型参数向量;(4)将参数代入预测模型进行数据预测及模型检验。,软件得到的数据如左所示 其中后验差比值、小误差概率、关联度精度等级都是一级,相对误差为二级图:预测的曲线为红色,实际数据的曲线为蓝色,GM(1,N)模型的案例和软件实现,2.科学出版社的GM(1,2)模型教学例题:设系统特征数据序列为相关因素数据序列为试建立GM(1,2)模型。,模拟误差检验表,Verhulst模型的案例及软件实现,3.根据泉州安吉路软基试验段路堤沉降观测值,采用Verhulst模型对其进行沉降预测。每7天观测数据为:-166,-286 ,-394 ,-497,-597,-689,-779,-871,-960,-1039,-1113,-1183,-1236,-1282,-1322,-1353,-1377,-1391,-1398,-1402mm,预测最终沉降。,谢谢!,