1、一、原始依据(包括设计或论文的工作基础、研究条件、应用环境、工作目的等。)工作基础了解数据挖掘技术的基本方法,能熟练使用MATLAB软件。研究条件利用MATLAB实现基于独立成分分析的流程工业过程监控方法的研究与仿真。应用环境基于独立分分析法的数据信息挖掘技术的研究工作目的熟练掌握MATLAB的M文件编程掌握故障诊断技术的基本分类以及基于信号处理的方法的基本步骤。二、参考文献1刘磊,张宇明,钱积新统计过程在连续生产中的应用J化工自动化及仪表,第24卷,19952于俊英,连岳SPC在柔性设计制造中心生产加工中的应用J航空制造技术,20053张公绪,孙静统计过程控制与诊断J质量与可靠性,20024
2、刘阶萍,罗振璧,陈禹六工序能力指数的统计分析与改进J北京科技大学学报,第26卷第2期,20045高岩,杨慧中一种主元分析方法在聚合生产过程故障检测与诊断中的应用J江南大学学报(自然科学版),20056王海清,宋执环,李平改进PCA及其在过程监控与故障诊断中的应用J化工学报,第52卷第6期,2001年6月7JFMARCGREGORANDTKOURTI,STATISTICPROCESSCONTROLOFMULTIVARIATEPROCESSESJ,CONTROLPRACTICE,VOL3,NO3,403414三、设计(研究)内容和要求(包括设计或研究内容、主要指标与技术参数,并根据课题性质对学生提
3、出具体要求。)1、掌握MATLAB的基本使用方法,能够独立完成基本的算法设计。2、研究基于ICA方法的故障诊断的方法和程序实现。3、对实际的诊断效果做出相应的评价。指导教师(签字)年月日审题小组组长(签字)年月日天津大学仁爱学院本科生毕业设计(论文)开题报告课题名称基于ICA的流程工业故障诊断系统的研究系名信息工程系专业自动化学生姓名指导教师一、课题来源及意义独立陈分分析(INDEPENDENTCOMPONENTANALYSIS),最早应用于盲源信号分离(BLINDSOURCESEPARATION)。ICA方法最早是由法国的JHERAULT和CJUTTEN于80年代中期提出来的,现在常称他们的
4、方法为HJ算法,可以说是最经典的ICA算法之一。目前比较流行的ICA算法有INFOMAX算法(信息最大化)、FASTICA算法(定点算法,FIXEDPOINT、快速ICA算法),犯非法分类的依据主要是求取分离矩阵W的方法不同。随着科技的发展,过程工业系统的规模在逐渐扩张,工艺也越来越复杂,使得人们不得不将过程的可靠性以及安全性能重视起来;此外,过程工业通常对生产环境的要求亦非常严格,尤其是在石油炼制、化工、电力、钢铁、冶金等流程工业生产过程中极为突出。在现代化生产过程中,过程故障检测及其相关技术的研究有着深刻的理论价值和不容忽视的重要性。几年来,过程监控已经成为过程自动化和过程控制领域的重要研
5、究方向,并成为构成系统可靠性、安全性、维修性等学科的关键技术之一。二、国内外发展现状独立成分分析(ICA)作为近年来发展起来的一种新的统计信号处理方法,与传统的PCA方法相比,它更有效的利用了高价信息统计量和非高斯信息,并能对数据的独立性问题作出分析。ICA在生物医学信号处理、混合语音分离、盲源信号分离、图像处理以及人脸识别领域已获得了成功的应用,但在化工过程性能监控方面的应用还很少。自20世纪90年代以来,基于多元统计投影理论的过程性能监控和故障诊断技术受到了学术界和工业界的广泛重视,并在化工生产过程得到了成功应用。三、研究内容利用MATLAB实现基于独立成分分析的流程工业过程监控方法的研究
6、与仿真。以主元分析(PCA)和偏最小二乘(PLS)为代表的多元统计方法事先假定测量数据服从同一正态分布,而且来自单一的稳定工况,事实上,对于实际的化工过程而言,大多数变量并不服从正态分布,实际的过程信息是高斯信息和非高斯信息的混合体。另外,大部分工业过程都不是运行在单一的工况下,相反,在各种工业生产过程中,普遍存在着工况的切换问题。在这种情况下,用传统的多变量统计过程技术(如PCA)对过程进行监控,势必会导致过程性能分析不准和过程故障的误报、漏报。针对传统多变量统计过程监控技术要求过程信息服从正态分布的约束性,应用基于独立成分分析方法的过程监控方法对典型生产过程监控与故障诊断的研究。对生产过程
7、正常运行状态下的历史数据进行小波降噪和独立成分分析,建立优化的独立元模型,利用独立元模型对生产过程仿真实时数据进行在线监控,采用SPE统计量、2DI统计量和2EI统计量判断系统是否发生故障。检测到异常变化时,使用变量贡献图确定故障源,实现故障的分离。五、研究方法与手段1将MATLAB70作为后台服务程序完成对离线过程信息的降噪分析及优化的ICA模型的建立,将仿真实时数据投影到该模型,采用SPE统计量、2DI统计量和2EI统计量完成生产过程故障的检测。2以MATLAB70为过程监控平台。应用优化的ICA模型对仿真实时数据进行在线监测,采用DDE动态数据交换的方法将实时数据传送到MATLAB后台服
8、务器程序计算SPE统计量、2DI统计量和2EI统计量实时值,并将与相应的控制限相比判断系统是否发生故障;使用变量贡献图确定故障变量,完成过程在线监测与故障诊断。六、进度安排1、2014121020150305查找资料,通过书籍和视频学习小波分析和主元分析法的基本理论,初步练习使用MATLAB软件。了解独立成分分析ICA的基本概念。完成开题报告。2、2015030620150329掌握MATLAB的M文件编程。3、2015033020150420编写程序,完成MATLAB中的算例仿真。4、2015052120150525系统分析ICA应用的多尺度分解与离线建模。5、201505262015060
9、5撰写论文,准备答辩。二、参考文献1刘磊,张宇明,钱积新统计过程在连续生产中的应用J化工自动化及仪表,第24卷,19952于俊英,连岳SPC在柔性设计制造中心生产加工中的应用J航空制造技术,20053张公绪,孙静统计过程控制与诊断J质量与可靠性,20024刘阶萍,罗振璧,陈禹六工序能力指数的统计分析与改进J北京科技大学学报,第26卷第2期,20045高岩,杨慧中一种主元分析方法在聚合生产过程故障检测与诊断中的应用J江南大学学报(自然科学版),20056王海清,宋执环,李平改进PCA及其在过程监控与故障诊断中的应用J化工学报,第52卷第6期,2001年6月7JFMARCGREGORANDTKOU
10、RTI,STATISTICPROCESSCONTROLOFMULTIVARIATEPROCESSESJ,CONTROLPRACTICE,VOL3,NO3,4034148RISERMANNANDPBALLTRENDSINTHEAPPLICATIONOFMODELBASEDFAULTDETECTIONANDDIAGNOSISOFTECHNICALPROCESSESINPROCOFTHE13THIFACWORLDCONGRESS,VOLUMEN,PAGES112,PISCATAWAY,NEWJERSEY,1996IEEEPRESS9PKESAVANANDJHLEEDIAGNOSTICTOOLSFOR
11、MULTIVARIABLEMODELBASEDCONTROLSYSTEMSINDENGCHEMRES,3627252738,199710JEJACKSONQUALITYCONTROLMETHODSFORTWORELATEDVARIABLESINDUSTRIALQUALITYCONTROL,726,195611JEJACKSONQUALITYCONTROLMETHODSFORSEVERALRELATEDVARIABLESTECHNOMETRICS,1359377,195912RODUDAANDPEHARTPATTERNCLASSIFICATIONANDSCENEANALYSISJOHNWILEY
12、ICA小波分析ABSTRACTTHEPROCESSMONITORINGANDFAULTDIAGNOSISISONEOFTHEMOSTIMPOTANTPROBLEMINTHEPROCESSINDUSTRYTHROUGHMONITORINGTHESTATEOFTHEPRODUCTIONPROCESS,DETECTINGTHEFAULT,PROCESSUPSETSANDOTHERABNORMALEVENTSPROMPTLY,LOCATINGANDREMOVINGTHEFACTORSCAUSINGSUCHEVENT,THESAFETYOFPRODUCTIONPROCESSWILLBEASSUREDAN
13、DTHEQUALITYOFTHEPRODUCTWILLBEIMPROVEDWITHTHEDEVELOPMENTOFPRODUCTIONPROCESSTECHNOLOGY,PROCESSPERFORMANCEMONITORINGISANIMPORTANTDEVELOPMENTDIRECTIONANDTHISPAPERANALYSESTHECURRENTSITUATIONOFMULTIVARIATESTATISTICALPROCESSMONITORINGCONTROLMSPCMETHODANDTHETECHNOLOGYINTHEFIELDOFPROCESSMONITORINGBASEDONTHET
14、HEORYOFMSPCANDWAVELETANALYSIS,BUILDINGUPTHEINDEPENDENTCOMPONENTANALYSISICAMODELINGTHEORYFORTHELIMITATIONOFTRADITIONALMSPCMETHODSASSUMPTIONTHATPROCESSINFORMATIONMUSTBESUBJECTEDTONORMALDISTRIBUTION,ICAISAPPLIEDTOFAULTDIAGNOSISTHISPAPERFORPROCESSMONITORINGVARIABLESASRESEARCHOBJECT,BUILDINGUPTHROUGHOUTT
15、HEINDEPENDENTCOMPONENTANALYSISOFHISTORICALDATAUNDERNORMALOPERATIONUSEINGSPE,2DIAND2EISTATISTICTODETECTTHEREALTIMEONLINETOJUDGEIFTHEREISASYSTEMFAULT,ANDMAKINGUSEOFTHEVARIABLECONTRIBUTIONDIAGRAMTOFINDTHEFAULTSOURCEFORTHEFAULTSEPARATIONTHERESULTSHOWSTHATFORTHEPROCESSINFORMATIONBEINGPOLLUTEDBYINDUSTRIAL
16、NOISE,COMPAREWITHTRADITIONALICAPROCESSMONITORINGMETHOD,THEICAPROCESSMONITORINGWITHWAVELETDENOISINGHASLOWOMISSIONANDFALSEALARMRATE,IMPROVESTHEACCURACYOFPROCESSPERFORMANCEMONITORING,ANDFURTHERTESTIFIESTHATTHEVALIDITYOFICAWITHWAVELETDENOISINGBUILDINGUPICAASPROCESSMONITORINGALGORITHM,VISUALBASIC60ANDMAT
17、LAB70ASDEVELOPMENTTOOL,TRAININGSYSTEMASDATAENVIRONMENTTOREALIZEONLINEMONITORINGANDFAULTDISPLAYOFTHEOILGASWATERSEPARATIONSYSTEMKEYWORDSPROCESSMONITORINGICAWAVELETANALYS1目录第一章绪论111引言112过程监控基本概念113过程监控的常用技术214基于多变量统计方法的过程监控的研究现状515本文主要研究内容6第二章独立成分分析法监控理论721ICA概述722ICA的基本模型及约束条件723ICA的估计原理924ICA的基本算法12第
18、三章小波降噪独立成分分析方法分析1431小波变换的基本理论1432小波降噪的基本原理15第四章基于小波降噪ICA的过程监控仿真1841过程监控ICA模型的建立1842变量贡献图2243离散系统多变量过程23第五章总结与展望2651总结2652展望26参考文献27外文资料2中文翻译致谢天津大学仁爱学院2015届本科生毕业设计(论文)1第一章绪论11引言流程工业是国民经济发展中极为重要的支柱产业,在工业结构中,流程工业涉及的行业十分广泛,主要包括石油、化工、冶金、制药、电力等原材料加工和能源工业,其生产过程一般是连续的或成批的,需要严格的过程控制和安全性措施,具有工艺过程相对固定、生产周期短、产品
19、规格少批量大等特点1。随着计算机科学的发展,尤其是计算机技术、自动控制技术、通信技术水平的日益提高,流程工业不断的向大型化、集成化、复杂化和精细化的方向发展,故障发生的可能性也随之增加;同时,市场竞争的加剧,能源、环保要求的提高,迫使人们不得不考虑工业设备及控制系统的可靠性和安全性。如果过程出现了故障不能及时排除,不仅会让企业蒙受巨大的经济损失,而且严重威胁着人身安全,造成严重的环境污染。为了保证生产的稳定、高效、安全运行和产品质量的一致性,对流程工业的复杂生产过程进行快速有效的实时监控显得越来越重要,作为其中一个可靠的解决手段,工业过程性能监控和故障诊断逐步成为过程控制领域的研究热点,并成为
20、构成系统可靠性、安全性、维修性等学科的关键技术之一,在现代化生产过程中不仅有着深刻的理论价值,更具有不容忽视的现实指导意义。12过程监控基本概念流程工业中的过程监控又常称为故障诊断,它与标准过程控制既有具有共同点,两者都是在系统受到扰动或发生过程异常变化时,采取一定的措施,使系统工作保持稳定,进而提高系统的工作性能。从广义上讲,过程监控就是对过程监控系统运行中的各种状态信息和已有知识信息进行综合处理、最终得到关于系统运行状态和故障状况的综合评价过程。实时有效的过程监控可以提高系统运行的安全性和保障性,减少停产时间,降低生产成本,优化其生产结构。过程监控系统主要对生产过程的运行状态进行监督,不断
21、检测过程的变化和故障信息,以防止灾难性事故的发生,同时减少产品质量的波动等2。过程监控的目的主要是监视生产过程的运行状态,推断系统是否正常运行,通过不断检测过程变化和故障信息,提高过程系统运行的安全性和可靠性。过程监控的目标就是推导出对所有可能的故障都具有最大灵敏度和鲁棒性的量度,通过对过程的异常变化进行分析,判别系统是否发生故障,并对故障幅度进行定量分析,确定故障类型、位置、量级和时间。必要时进行过程干预和恢复。过程监控的核心为过程故障检测。对于大多数流程工业系统而言,过程监控的任务由低级到高级主要包括过程故障检测、过程故障识别、过程故障诊断、过程故障评价与天津大学仁爱学院2015届本科生毕
22、业设计(论文)2决策。过程故障检测通过对生产过程特征信息进行分析,判别其是否超出预定的范围,确定系统是否有故障发生。较早检测到故障可以对即将出现的问题做出重要的警告,进而采取适当措施避免它发展为重大的过程故障,使最终产品质量不受影响,或损失减到最小。过程故障识别根据检测到的故障信息,识别出与故障最密切相关的观测变量,以便更好的分析故障的成因,减少恢复受控运行状况的时间。过程故障诊断此处是指狭义的故障的诊断,仅指根据上面的结论以及其他知识确定哪种故障发生了,具体的说就是最终确定故障的类型、强度以及发生的时间位置,换句话说就是确定故障状态的原因。过程故障评价与决策判断故障的发展趋势以及对监控对象的
23、影响,并针对不同的工况采取不同的措施,确保过程的正常运行。一般来讲,工业过程监控图11所示如下NY故障检测故障识别故障诊断故障评价与决策图11工业过程监控图13过程监控的常用技术传统的过程监控技术是采取阈值检测和偏差检测。如果观测值超过预定义的阈值,即产生报警。这种方法容易于实现和理解。但是当系统的状态变化时,对应原阈值就不再适用,另外,它没有考虑过程变量之间的相互作用,它对过程的干扰缺乏灵敏性。偏差检测是通过比较仿真数值和实际观测值,根据一致性情况来产生报警。偏差检测直接依赖于模型的准确性,模型的不准确在实际中是不可避免的。因为很难将真正的故障和模型的误差区别开来,所以偏差检测缺乏鲁棒性3。
24、1971年,美国学者BEARD首次提出用解析冗余代替硬件冗余故障检测和诊断的思想,为过程监控理论的发展奠定了基础,同时,也促进了过程监控体系的完善。由于过程监控的核心为故障检测及诊断,因此故障诊断的分类方法同样适用于过程监控。到目前为止,随着统计学、信号处理、智能理论的引入,故障诊断技术得到了极大的发展,故障诊断方法也有了不同的分类。对于整个故障诊断的领域,按照国际故障诊断权威PMFRANK教授的观点,故障诊断方法可以划分为以下三类基于解析模型的方法、基于知识的方法、基于信号处理的方法4。天津大学仁爱学院2015届本科生毕业设计(论文)3131基于解析模型的方法基于解析模型的故障诊断方法主要依
25、赖于精确的过程模型,通过将被监控对象的可测信息和由数学模型重构的过程特征信息进行比较,从而产生残差,并通过对残差的统计分析和处理而实现故障检测和故障识别的技术5。残差是别监控对象观测值和数学模型之间一致性比较的结果,在较好的条件下,如果发射过了故障,残差或它的变形将显著偏离零点,否则如果只是扰动、噪声或者模型误差,那么残差的只会比较小,多以可以定义适当的阈值来检测故障是否存在。根据残差产生形式的不同,基于模型的故障诊断方法又可细分为状态估计方法、参数估计方法和等价空间方法,三种方法之间又存在着独立统一的关系。状态估计方法状态估计方法的基本思想是利用系统的解析模型和可测信息,设计检测滤波器(观测
26、器),重建系统的可测变量,然后由滤波器的输出与真实输出的差值构造残差,在对残差进行分析处理,实现系统的故障检测和分离。在能够得到系统的精确数学模型的情况下,状态估计的方法是最为直接有效的。然而在实际工业过程中,精确过程模型很难确立,所以目前对于状态估计法的研究主要解决如何提高检测系统对于建模误差、扰动等未知输入的鲁棒性等问题上。等价空间法等价空间方法最早是由CHOW等利用动态系统的暂时冗余关系而总结出来的,其基本思想是通过系统的输入输出(或部分输出)的实际值检验被监控对象数学模型的一致性(等价性),从而达到检测和分离故障的目的。这些关系能够给出表示传感器输出之间的静态代数关系的直接冗余或者被诊
27、断对象的输入输出之间动态关系的瞬时冗余。该方法是一种无阈值的方法,特别适用于维数较低的被测量变量的冗余信号的优劣判断。参数估计方法对于发生了故障的系统而言,它包括的参数可以分为两类一类是系统参数,即描述系统动态特性的数学模型中的定常或时变参数;另一类是故障参数,即用于描述故障信号自身特性的参数。因此可以根据模型参数及其相应的故障参数变化来检测和分离故障。与状态估计方法相比较,参数估计方法更有利于故障的分离。参数估计方法要求找出模型参数和故障参数之间的一一对应关系,将参数估计法和其他基于解析模型的方法结合起来,能更好的故障检测和分离。132基于知识的故障诊断方法基于知识的方法就不需要被监控对象的
28、精确数学模型,主要利用了人工智能的方法,适用于有大量生产经验和工艺知识可以利用的场合。天津大学仁爱学院2015届本科生毕业设计(论文)4目前研究的比较深入也比较广泛的基于知识的故障诊断方法是基于症状的方法,主要有以下几种基于专家系统的智能诊断方法专家系统的故障诊断方法,是指计算机在采集被监控对象的过程信息后,在一定推理机制指导下,综合各种规则,进行一系列的推理判断,快速的找到最终故障或者最有可能的故障的过程,目前已广泛用于工业过程监控系统中。专家系统故障诊断其根本目的在于利用专家的领域知识,经验为故障的诊断服务,但它的应用依赖于专家的领域知识的获取,知识获取是一个难点。另外在自适应能力、学习能
29、力及实时性方面也都存在不同程度的局限性。基于模糊理论的方法该方法的总体思路是利用集合论中的隶属函数和模糊关系矩阵的概念来解决故障和征兆之间的不确定性关系,进而实现故障的检测与诊断。基于模糊理论的方法适用于测量值较少,含有模糊现象和不确定信息且无法获取精确数学模型的系统,由于该方法不具备自学习能力,模糊规则过多依赖于经验等诸多原因,致使它对和模糊规则接近的故障诊断结果较为准确,而对新颖的故障诊断效果则较差6。基于模式识别的方法模式识别方法对是多变量过程进行故检测与识别的有效途径。它首先选择出对故障敏感的特征参数进行训练处理,提取关键信息,以建立各种故障的基准模式集,再由实测的信息采用模式匹配算法
30、与已建立的故障基准模式集进行模式匹配,从而检测和分离出故障。基于模式识别方法的困难在于如何表达相同故障的特征且必须具有大量系统的历史样本。基于神经网络的方法人工神经网络(ANN)用于故障诊断主要有以下4种形式1用神经网络产生残差信号;2用神经网络进行残差评价分析;3利用神经网络作自适应误差补偿;4直接利用神经网络进行故障诊断推理。由于ANN具有记忆、自学习、和能拟合任意连续非线性函数的能力以及它的并行处理、全局作用的能力,使它在处理非线性问题和在线估计等方面具有很强的优势,在复杂系统的故障诊断中得到了广泛的重视。但是,用神经网络进行故障诊断也存在一定的缺陷,该方法难以利用经验知识进行诊断,网络
31、结构和规模的选取存有未知性,算法的收敛性、实时性、快速性难以保证等。133基于数据驱动的方法目前,工业过程通常拥有丰富的观测变量数据,因此对过程进行监控时,可以以采集的过程数据为基础,通过各种数据处理与分析方法如多元统计方法、聚类分析、小波分析等挖掘出数据中隐含的信息,从而指导生产,提高监控系统的监控能力,比较天津大学仁爱学院2015届本科生毕业设计(论文)5符合流程工业的特点,通用性强。基于数据驱动的方法利用多变量统计过程控制技术将过程信息数据空间划分为过程特征信息子空间以及残差空间7。特征信息子空间刻画了整个过程正常运行的状态及其规律,而其残差空间只涉及到过程极少的信息或一些噪声信息。由于
32、故障与过程特征信息之间存在内在关系,当故障发生时,将会引起过程特征信息在幅值和结构等方面的变化,进而在监控模型中体现出与过程正常运行状况不同的性状,由此完成对过程性能的监控。根据在子空间中特征信息提取方式的不同,这类过程监控的方法又可分为主成分分析方法PRINCIPALCOMPONENTANALYSIS,PCA、独立成分分析法INDEPENDENTCOMPONENTANALYSIS,ICA、偏最小二乘法PARTIALLEASTSQUARE,PLS等。数据驱动方法是建立在严格的统计研究基础上的,其优势在于它们能够把过程数据从高维空间投影到低维空间,并从中获取重要的过程特征信息。通过统计分析方法计
33、算过程信息中占主导地位的相关统计数据,提高复杂系统的过程监控性能,减少企业不必要的损失。基于数据驱动的过程监控方法不需要过程的精确解析模型,所获得的理论成果和方法能够较快地应用于实际工业生产中。目前,基于数据驱动的方法实现过程问题更具有实际的意义。与此同时,在分析过程数据的同时我们也必须要考虑其过程数据质量,大小,数据的时变性,数据的多尺度性,数据的非线性,数据的动态特征等问题。本文研究的是FPSO流程工业生产过程监控问题,采用基于数据驱动的方法比较稳妥,开展基于数据驱动的工业过程性能监控的研究,是一个既有理论意义,又有很高应用价值的研究课题。14基于多变量统计方法的过程监控的研究现状流程工业
34、中生产过程复杂,规模大,难以建立准确的数学模型。另一方面,流程工业中传感器获取过程数据的更新速度快,均为实现基于多变量统计方法提供了基础。多变量过程统计方法是在单变量统计的基础上发展起来的,近几年来多变量过程监控方法在生产过程中得到了广泛的研究与成功的应用8。多变量过程统计方法主要采用各种投影降维方法来实现。投影算法的基本思想是将由大量测量变量所张成的高维空间投影到低维主元变量或者隐变量模型空间,以便用更少的维数来描述整个过程的主要特征。目前多元统计过程方法主要有主元分析、偏最小二乘、典型相关分析等,其中主元分析的理论研究较多。PCA方法在统计过程控制领域中应用已经较为普遍,并取得了良好的成果
35、,但PCA只针对过程数据的二阶统计特性,不能很好的刻画过程数据的特征信息,所以基于主元分析的多元统计过程监控方法在某些工业过程中的应用不是很理想。并且需要指出的是标准多元统计方法在推导过程中,一般作了如下假定1过天津大学仁爱学院2015届本科生毕业设计(论文)6程变量都服从高斯正态分布;2过程处于稳态4过程是线性的;针对上述PCA方法的局限性,作为PCA延伸的独立分量分析ICA作为近年来发展起来的一种新的统计信号处理方法,该方法同时还适用于过程信息非正态分布的情况。与PCA相比,具有更高的通用性和适应能力,符合实际过程的需要,具有更高的普遍意义。目前ICA在国外发展得比较快,在国内起步不久。I
36、CA方法是基于过程数据高阶统计特性的分析方法,可以有效的处理服从非高斯分布的过程数据,使得变换以后的各分量之间不仅互不相关,而且还尽可能地统计独立,更好的刻画变量的概率统计特性,抑制高斯噪声,展示了ICA方法在故障早期侦破中良好的应用前景9。近些年来,随着信号处理与模式识别技术的发展,在多元统计过程控制MULTIVARIATESTATISTICALPROCESSCONTROL,MSPC领域涌现出许多新的方法,这些新兴的理论不仅仅停留在降维的层面,而是通过对数据更深层内涵的发掘达到过程监控的目的。15本文主要研究内容本文以多变量统计过程控制理论、小波变换为基础,在此基础上结合独立成分分析的建模原
37、理建立基于ICA的典型生产流程过程监控系统。其主要工作如下1将MATLAB70作为后台服务程序完成对离线过程信息的降噪分析及优化的ICA模型的建立,将仿真实时数据投影到该模型,采用SPE统计量、2DI统计量和2EI统计量完成生产过程故障的检测。2以MATLAB70为过程监控平台。应用优化的ICA模型对仿真实时数据进行在线监测,采用DDE动态数据交换的方法将实时数据传送到MATLAB后台服务器程序计算SPE统计量、2DI统计量和2EI统计量实时值,并将与相应的控制限相比判断系统是否发生故障;使用变量贡献图确定故障变量,完成过程在线监测与故障诊断。根据以上内容,本文安排如下第二章基于独立成分分析的
38、过程监控理论主要介绍和分析了独立分量分析方法的基本模型、约束条件,估计原理,通过对独立成分分析估计原理的介绍,本文选取非高斯最大化中的近似负熵作为目标函数,完成目标函数的确立,提出改进的快速ICA算法,解决了快速ICA算法中初值选择的敏感性问题。第三章小波降噪独立成分分析方法概述小波变换的基本理论分析及小波降噪原理分析。第四章建立小波分析和独立成分分析相结合的基于小波降噪独立成分分析的过程监控方法和过程监控仿真模型,并在MATLAB中仿真分析。第五章总结与展望综合本文所做的工作分析其中的不足,并指出下一步工作的方向。天津大学仁爱学院2015届本科生毕业设计(论文)7第二章独立成分分析法监控理论
39、多数工业生产中,过程观测信息很难完全服从高斯分布,针对传统多变量统计过程监控技术要求过程信息服从正态分布的约束性,本文提出基于独立成分分析INDEPENDENTCOMPONENTANALYSIS,ICA的过程监控方法,该方法不要求数据服从一定的分布条件,主要按照统计独立的原则,从过程观测信号中分离出统计独立成分。本章从盲源信号分离的理论出发,进而对ICA的数学模型、目标函数、估计算法进行了详细地阐述。21ICA概述独立成分分析是伴随着盲源信号分离问题而发展起来一种基于过程信息的高阶统计特性的分析方法11,独立成分分析方法有较强的信号分析处理能力主要是从多元统计数据中寻求内在统计独立成分,与传统
40、的多元统计控制方法相比,一方面,ICA不需要变换后的独立成分满足正交条件;另一方面,ICA不仅去除了变量之间的相关性而且包含了过程观测变量的高阶统计特性,能更好的刻画变量的概率统计特性,抑制高斯噪声,同时通过ICA方法得到的独立成分分量满足统计意义上的独立性特点。再者,独立成分分析方法,不要求数据服从特定的分布条件,具有更高的普遍意义,符合实际过程的需要,比PCA具有更高的通用性和适应能力。ICA作为一种新的信号处理方法,在混合语音分离、生物医学信号处理、金融数据处理、遥感图像处理、无线通信信号处理、过程监控等方面得到广泛应用12。ICA作为传统多元统计过程控制方法PCA的延伸,以实际工业生产
41、过程观测数据为研究对象,其目的是从过程观测信号中分离出统计独立的源信号。从统计信号的角度来看,ICA利用过程观测信号统计独立的特性,通过确定一个非正交线性变换的分离矩阵W,使得混合信号变换后的输出分量尽可能的统计独立。22ICA的基本模型及约束条件221ICA的基本模型独立成分分析是伴随着盲源分离问题而发展起来的基于信号高阶统计特性的一项新的信号处理方法,其目的是从线性观测信号中恢复出统计独立的源信号13。最早提出ICA概念的是JUTTEN和HERAULT。为了给出ICA的严格定义,我们可以使用统计上的隐变量模型,假设M个观测变量MXXX,21,它们分别是N个非高斯分布的独立成分变量NSSS,
42、21的线性组合,其中,独立成分分量和测量变量都是已经均一化的数据,其原理模型如式21SAX21TMXXXX,2122TNSSSS,2123天津大学仁爱学院2015届本科生毕业设计(论文)8式中,NMRA为未知的混合矩阵;X为M个变量观测值;S为N个独立的非高斯源信号。每个测量值被分解成为一组独立源的线性组合TMIMTITITISASASAX2211MI,124式21描述了观测数据如何由独立成分分量混合而成。在独立成分分量S和混合系数矩阵A均未知,仅在过程观测变量X己知的情况下,目前我们要解决的问题正是如何在已知尽可能少的假设条件下,估计出A和S。而ICA的目的正是寻求分离矩阵W,对源信号进行估
43、计,使得估计信号中S尽可能的独立SWASWXS25独立分量分析方法的原理框图如图21所示。图21独立分量分析方法的原理框图222ICA的约束条件在已知观测信号X,而源信号S和混合系数A都未知的情况下,为确保独立分量分析方法的顺利进行,使得式21的ICA模型能得到独立成分分量S相应的估计值,必须要求它满足一定的假设条件和约束条件。1独立成分假定是瞬时统计独立的统计独立性是构成独立分量分析基础的关键,但只要满足该条假设,就可以建立ICA模型,这是ICA方法可以应用于众多领域的原因之一。对于随机变量NYYY,21,如果任意JI的随机变量IY和JY之间,IY包含的信息与JY的值无任何关系,那么则称NY
44、YY,21相互独立14。从概率统计学的角度来看,独立可以通过概率密度来定义。在概率统计中,设两个随机变量1Y和2Y,其概率密度函数和联合概率密度函数分别是2211,YPYP,21,YYP,当且仅当下式成立时221121,YPYPYYP26随机变量1Y和2Y是统计独立的。这个定义可以扩展到N个随机变量的情况。定义NYYYP,21为联合概率密度函数,IIYP为IY的边缘概率密度函数。如果随机变量NYYY,21满足独立条件,则联合概率密度函数等于各边缘概率密度函数的乘积。即NNNYPYPYPYYYP221121,27在实际应用中,由于随机变量的概率密度函数很难获得,因此一般并不采用严格的理论证明,而
45、是根据源信号产生的实际背景进行判断。通常各个源信号是由不同的实际物理系统发出的,它们之间没有必然的联系,可以认为满足统计独立的约束条件。天津大学仁爱学院2015届本科生毕业设计(论文)92独立成分分量必须具有非高斯的分布,或者至多存在一个独立成分分量服从高斯分布。高阶统计信息对于估计ICA模型来说是必须的,独立成分分析主要是依据过程观测变量的高阶统计信息来估计ICA基本模型。高斯分布的高阶累积量都为零,而且高斯变量的线性组合仍然服从高斯分布,由此可见在混合前后其高阶统计信息没有区别,这样就导致无法从混合信号中分离出统计独立的源信号,所以,如果观测变量是服从高斯分布,ICA模型就无法被估计。在I
46、CA基本模型中,并不需要假定独立成分分量服从何种分布,如果能已知,则问题会变的相当简单。3观测变量X的维数不小于独立成分分量S的维数观测信号的数目多于独立源信号时,能够获得包含所有独立源信号的信息,这样利用独立成分分析方法对过程信息进行分析获取统计独立的源信号时,能更好的刻画变量的概率统计特性,就可以得到较为准确的结果。由于实际工业过程中可以采集到大量的观测数据,该约束条件在实际工业生产中也具有可行性,这样不但提高了测量的可靠性,也为ICA提供了丰富的观测信号。23ICA的估计原理根据前面建立的ICA模型和独立性概念,可知独立分量分析就是寻找一个变换矩阵W作用于混合信号,使得输出信号统计独立。
47、下面主要介绍对ICA模型进行估计的不同计算方法。当前使用的方法主要有非高斯的最大化、互信息的最小化和最大似然函数估计。231非高斯最大化非高斯性在ICA模型的估计中扮演着极为重要的角色,如果没有非高斯性,ICA估计根本无法实现,因此,非高斯性可用于ICA估计并作为其中的关键。概率论中的中心极限定理表明,在一定的条件下,独立随机变量的和趋于高斯分布,它比原始随机变量中的任意一个更趋于高斯分布;反之,则任意一个原始随机变量比随机变量的和更偏离高斯分布15。在独立成分分析的模型中,观测信号是由独立源信号的线性组合,它比任意一个独立源信号更接近于高斯分布,可用分离信号的非高斯性作为分离信号间独立性度量
48、。如果寻求向量W作用于混合信号,使得变换后的结果尽量偏离高斯分布,即非高斯最大化,即可以得到统计意义上的一个独立源信号。同理按照此规则可以分离出余下独立源信号。也就是说最大化信号的非高斯性和独立性是一致的,这也就是所谓的“非高斯性就是独立性”。当源信号被假设为相互独立并且不具有时间结构时,采用高阶统计量作为独立性、非高斯性的度量。此时,源信号中最多只能有一个高斯信号。估计非高斯性的测量标准有是峭度和负熵。天津大学仁爱学院2015届本科生毕业设计(论文)101基于峭度的非高斯性度量峭度是随机变量的四阶累计量的另一种叫法,是一个高阶累计量,主要引用高阶多项式方差的泛化,是一种经典的非高斯度量。随机
49、变量Y的峭度KURTY被定义为2243YEYEYKURT28注意上式中的所有随机变量都假定是零均值的。为了简化问题,我们还可以进一步假设随机变量Y已经被标准化过,其方差12YE,公式的右边简化为34YE。这说明峭度实际上就是四阶矩的一种规范化形式。这样对于高斯分布的变量Y,243YEYE,因此高斯变量的峭度为0。对于大部分但并不是所有的非高斯随机变量,峭度为非零值。峭度的值可正可负,具有负峭度的随机变量称为次高斯的,而那些峭度为正的随机变量称为超高斯的。超高斯随机变量的概率密度函数PDF一般是“顶尖厚边”的形状,即PDF在零附近和远离零处的取值较大,而在中间部分的取值较小。次高斯的概率密度函数一般是“扁平”形状,其在零附近的取值比较平坦,在远离零的地方取值很小。非高斯性通常可以由峭度的绝对值来度量,也可以使用峭度的平方16。这样的度量对于高斯变量的取值为零,而大部分的非高斯随机变量的取值大于零。实际也存在峭度值为零的非高斯随机变量,但可以认为这样的随机变量是非常少见的。该方法已经在ICA相关领域被广泛用作非高斯性的度量,这主要是因其无论从计算还是理论上都非常简单。从计算的角度,峭度可以简单