1、基于 Matlab 人工神经元网络的水质信息管理软件系统摘要:建立水质信息管理数据库,应用人工神经元网络建立 BOD-DO水质模型和水质评价模型,所得到的神经元网络模型对水质中的 BOD-DO指标有很好的模拟效果,同时也能根据地表水水质标准,对水质进行多参数评价。 关键词: 水质模型人工神经元网络 水质信息管理系统 中图分类号:TN948.61 文献标识码:A 1、研究背景 水质模型的建立以及多参数水质评价,往往需要很多算法,对这些算法的开发选择淘汰,需要很大的精力。Matlab 是一种较为理想的算法调试平台,但是其并不适合作为一种开发工具。然而实际应用中又需要对多算法进行灵活组合比较。因此应
2、用 matlab 平台进行以数据库为基础,以算法为支撑的应用系统具有开发周期短,灵活性大的开发方式。作者尝试以 SQLserver2000 为数据库源,以 matlab 为平台开发水质综合信息管理系统。 2、基于神经元网络的 BOD-DO 耦合模型 2.1BODDO 耦合模型综述 生化需氧量(简记为 BOD5)是对水体中可生物降解的有机物浓度的一个度量,它用细菌在好氧条件下将有机物氧化为 CO2H2O 和 NO3 一等时所用掉的氧的数量来表示。可以用溶解氧的变化说明河流的天然净化过程。纯净的河水中溶解氧是饱和的,当一定数量的污水流入河流时,受到污染的水中的溶解氧在有机物分解时被消耗(耗氧作用)
3、;同时由于河水中溶解氧不再饱和,所以大气中的氧又会溶解到水里(复氧作用);假定污水不再流入,经过一段时间,原来污水中的有机物完全分解,河水又回复到溶解氧为饱和的状况。这个过程一般要进行几天,为了确定过程中污染对河流的影响,需要沿水流方向查明生化需氧量和溶解氧量的变化的情况。要定量地描述生化需氧量与溶解氧量在选定河段范围内某一时间间隔内的变化就要建立数学模型。 利用 RBF 网络来进行水环境影响评价,只要有充足的采样数据,就可以利用神经网络的自学习能力来进行河水的建模与预测,这种方法考虑的因素较少,并且结果准确,适用范围很广,是一种很好的水环境预测方法。 2.2 实现方法BP 神经网络 将用户选
4、择上下两个断面,研究时段作为边界,查询相关的数据,以上游断面的生化需氧量为第一个变量 input1 溶解氧作为第二个变量 input2,水温 input3,流量 input4,作为输入变量,将下游断面的生化需氧量 output1 和溶解氧 output2。作为输出变量。依照 3 个隐含层,20个节点的网络参数(也可以由用户指定这些参数)建立 BP 神经网络。 原始数据的非线性规格化。大多数 BP 神经网络模型以 s 形函数作为转换函数,该函数的值域为0,1,因此在网络训练时要将原始数据规范到0,1区间。但是规范后的每个输出的教师值序列中至少有一个值为 0,一个值为 1,恰好是 s 形函数的极小
5、值和极大值,要求联接权足够大才能使网络的输出值与其匹配,从而需要相当多的训练次数来不断修正权值,导致训练速度缓慢。 因为不同指标的数量级差别很大,为了有效的对网络进行训练。对数据进行预处理。 首先将数据采用 sigmoid 函数,进行非线性映射。然后使用tranlm()函数来训练网络。达到预设误差范围后,保存网络。 2.2.1 用于 BOD-DO 耦合模型的 BP 神经网络的结构 BP 网络通常至少有一个隐含层,如图所示的是一个具有 R 个输入和一个隐含层的神经网络模型。 感知器与线性神经元的主要差别在于激励函数上:前者是二值型的,而后者是线性的。BP 网络除了在多层网络上与已介绍过的模型有不
6、同外,其主要差别也表现在激励函数上。 因为 S 型函数具有非线性的大系数功能。它可以把输入从负无穷到正无穷大的信号变换成1 到1 之间输出,所以采用 S 型函数可以实现从输入到输出的非线性映射。 2.2.2 BP 网络的学习方法 BP 网络最为核心的部分便是网络的学习规则。用 BP 算法训练网络时有两种方式:一种是每输入一样本修改一次权值;另一种是批处理方式,即使组成一个训练周期的全部样本都依次输入后计算总的平均误差。这里我们主要探讨的是后一种方式。 BP 网络的学习过程主要由以下四部分组成: 通常学习系数在 0.10.8 之间,为使整个学习过程加快,又不会引起振荡,可采用变学习率的方法,即在
7、学习初期取较大的学习系数随着学习过程的进行逐渐减小其值。最后,将输出误差由输出层经中间层传向输入层,逐层进行校正。 2.2.3 BP 网络的训练 对 BP 网络进行训练时,首先要提供一组训练样本,其中每个样本由输入样本和输出对组成。当网络的所有实际输出与其理想输出一致时,表明训练结束。否则,通过修正权值,使网络的实际输出与理想输出一致。 含一个隐含层的 BP 网络结构 首先:网络初始化,构造合理的网络结构(这里我们采用图 4.3 的网络结构) ,取可调参数(权和阀值)为-1,1上服从均匀分布随机数,并取定期望误差、最大循环次数和修正权值的学习率的初始值。 其次,利用相应的 BP 网络学习规则对
8、网络进行训练,求得权值修正后的误差平方和。最后,检查网络误差平方和是否降低到期望误差之下,若是,训练结束,否则继续。 3、水质评价系统 利用监测数据,对区域内特定时空的水质状况进行评价,并能模拟预设状况下的水质情况,并给予评价。 利用神经元网络算法将依据环境水评价标准各个参数界限随机生成数据作为样本,生成水质评价模型。将数据库内监测数据,显示输出。 在数据库中根据国标 GB3838-2002 的地表水评价标准,建立水质评价数据库,在软件中可以根据水质监测指标的种类选择需要评价依据的指标类别,然后根据用户输入的样本容量随机生成若干组 1-5 类和劣五类的水质指标样本,根据用户输入的神经元数目生成
9、评价模型。 3.1 选用的水质标准 根据 GB3838-2002 的地表水水质标准,将各个等级的水质指标的对应上下限输入数据库,以水质等级作为主键。由于标准中有相当部分的指标为非常规指标,或本次收集的材料中没有作为经常性,必检项目。例如生化需氧量,监测的数据就明显不足,因此无法应用于水质评价模型中,但水质评价标准数据库仍然有 BOD5 的指标标准,一旦有实际数据也同样可以进行评价。目前使用的水质指标有:溶解氧、 氨氮、 高锰酸盐指、 氰化物、 砷化物、 挥发酚 、 六价铬 、总汞、 镉、铅、 铜、 总磷、 氟化物、 大肠菌群、 总锌、 总氮、 阴离子表面、 石油类。 3.2 样本生成 利用神经
10、元网络算法将依据环境水评价标准各个参数界限随机生成数据作为样本,生成水质评价模型。 3.3 模型建立 用户指定断面,时段,以及多指标组合后,系统会根据用户指定的样本个数 m,和水质标准数据库,随机生成 1-5 类水质,以及超五类水质的,m 个水质随机样本。 然后系统建立一个 RBF 人工神经网络,他具有用户指定的或者系统推荐的隐含层节点数,以及用户指定或系统推荐默认的训练次数。对网络进行训练,如果训练结果达到用户要求,则可以将该模型,以时间+指标名列表的文件名,将模型存储。以便日后进行评价。 对于数值愈大污染愈重的指标(如酚、亚硝氮等) 对于数值愈大污染愈轻的指标(如溶解氧等) 来预处理数据。
11、这样输入输出数据将全部在02,08之间,可以大大加快网络学习速度,而数据的联系并不减少。 3.4 水质评价结果一致性分析 由于样本是由水质标准产生的,因此严格符合相应的水质标准可以作为评判标准。模型经过实际测试,评价准确率达到 75 以上%。 结语与讨论 应用 matlab 作为开发平台,界面编程存在很大挑战,UI 的实现存在困难。但是其灵活的算法,多样的算法工具箱,为最终高端信息的服务提供了全过程的调试便捷。一旦优化了界面流程,在开发过程中,内存,变量管理,算法优选,都是非常便利的。不失为一种较高算法难度下的开发平台选择。 参考文献: Foster J A , Mc donald A T 1
12、A s sensing pollution risk s to water supply intakes using geographical information system s ( GIS ) 1 Environmental Modeling & Soft ware12000, 15 (3) : 225 234 Lenze M A , Luzio MD, River run an interactive GIS and dynamic graphing website for decision support and exploratory data analysis of water
13、 quality parameters of the lower Cape Fear r iver1European Journal of A gronomy12003, 18 (6) :513 520 彭虹, 张万顺, 夏军 1 河流综合水质生态数值模型 1 武汉大学学报(工学版) , 2002, 35 (4) : 5659 彭虹, 郭生练 1 汉江下游河段水质生态模型及数值模拟 1 长江流域资源与环境, 2002, 11 (4) :363 369 雒文生, 宋星原 1 水环境分析及预测 1 武汉: 武汉水利电力大学出版社, 20001168 219 作者简介:刘志峻 男 硕士研究生 1976 年生 毕业于华中科技大学 武汉长澳大地工程有限公司,主持了中央级公益性科研院所基本科研业务费项目编号:YWF0742/ZY08;厄瓜多尔 CCS 水电站水情测报系统,富水水库水情信息化,富水视频管理信息系统等项目。