
打开文本图片集
摘要:针对水质评价问题,通过在各类水质污染指标浓度区间内生成随机分布样本的方法,并组成足够多的训练、检验和测试用的样本,提出一类新的结构优化算法CG-OBS,CG-OBS过程将最优脑外科(OBS)的结构评价作为目标函数的惩罚项,采用权值衰减的手段实现结构调整,建立了辽河水质综合评价的网络模型;给出了区分不同类别水质的模型分界值样本和模型输出分界值。
关键词:共轭梯度算法;水质;综合评价;样本
1.引言
有效利用江河湖泊水体,是实现可持续发展的重要内容之一。为更有效地利用和保护自然水体,首先必须对水体水质进行合理的综合评价与预测。针对辽河水体水质评价与预测的主要任务是,根据水体中反映污染程度的主要物质(据调研主要有溶解氧、BOD5、挥发酚、氨氮、亚硝酸盐氮、硝酸盐氮和高锰酸等)和石油类等物质的浓度和国家水质评价标准,分析、评价和预测水质的类别及其发展趋势,为水体管理提供科学的依据。目前水质评价方法主要是多因素的综合评价法,如灰色关联分析、模糊聚类分析法、物元模型法、灰色局势决策法和综合指数评价法等[1-3]。由于影响水质的因素很多,并且因素与水质类别之间通常存在复杂的非线性关系。神经网络具有很强的自学习性、自适应性和容错性,是处理非线性问题的较好选择。
神经网络预测模型的优劣,最重要的指标是网络的学习精度和泛化能力。前者保证模型的准确性;后者保证模型的推广性,是预测模型得以真正实用的关键因素。网络泛化能力与初始状态、网络结构、学习算法等因素均有密切关系,文献[4]指出,神经网络若需达到给定的泛化能力,必须使结构与样本相匹配,或者增加训练样本,或者减少网络规模。当训练样本一定时,较小结构的神经网络具有更好的泛化能力。目前,表现较好的结构优化算法之一为最优脑外科[5](OBS)过程,利用误差函数的二次导数信息,解析预测权值扰动对函数的影响程度,以自顶向下的方式削弱或消除某些连接权,实现结构优化。事实上,OBS算法优良的权值衰减率以其计算复杂度为代价,高达O(n2P)(n为网络权值数目,p为训练样本数目)网络修剪过程耗时长,并存在二次训练等系列问题,因而损害了算法的实用性。
本文继承了OBS的良好结构调整性,将OBS结构评价作为目标函数的惩罚项,采用约束形式的权值衰减策略,实现权值与结构的同时学习。为避免OBS评价所需二次导数的复杂计算,利用共轭梯度(Conjugate Gradient;CG)法[6]间接得到Hessian逆信息,推导出一类新的结构优化算法CG-OBS。该算法有效克服了OBS的计算复杂性,又可保持高效的结构优化性能。
2.最优脑外科(OBS)过程
OBS过程要求在网络学习结束后方可进行,因此目标函数ζav(W)在W附近的Taylor展开可近似为:
4.1.3足夠多样本的生成
由于5个水质评价标准(由各污染指标浓度上或下限组成)是区分各类水质的分界样本,输入变量(评价指标)又有6个,因此不可能用水质标准作为训练样本。为了正确和可靠地应用BP网络评价水质,生成足够多符合水质评价标准的训练样本和检验样本是关键。
由水质分类原理知,各类水质由各污染指标浓度的上(下)限决定。因此,各项污染指标值都在Ⅲ类水质规定的污染指标浓度区间内时,即前述各项污染指标值为≥5-6mg/L、≤4-3mg/L、≤0. 05-0. 01mg/L、≤0. 005-0. 002mg/L、≤0. 5-0 .1mg/L和≤8-4mg/L时,该水体水质肯定属于Ⅲ类。这样,在上述污染指标区间内进行随机(或均匀)取值,就能生成足够多属于Ⅲ类水质的样本。同理可生成其他各类水质的样本。本文共生成1200个样本,各随机抽取100个样本(约10%)为检验样本和测试样本。利用上述算法对水质水体进行BP网络的预测。
4.1.4网络模型的训练
本研究采用Statsoft公司出品的Statistical Neural Networks软件。将CG-OBS应用于上述的BP网络预测模型,取学习参数为:学习率α=0. 1,冲量η=0. 5(系统缺省值);结束学习的条件是训练样本的均方根误差(RMSE)小于0.1或趋于稳定或训练次数达到2000次。隐层和输出层均采用Sigmoid转换函数。根据前述建立BP网络模型的,隐层节点数为2和1时的网络训练误差(检验误差和测试误差相似)分别为0.1320和0.2187,隐层节点数为3-15时,误差都在0.13左右。因此,综合考虑网络误差大小与结构复杂程度,合理网络结构的隐层节点数为2,经过2000次学习,训练样本、检验样本和测试样本的均方根误差(RMSE)分别为0.1320、0.1365和0.1325,平均绝对误差(AAE)分别为0.09948、0.10200和0.09647,相关系数分别为0.9972、0.9967、0.9972。这些指标表明,经训练得到的网络模型对训练样本与对检验样本和测试样本具有相同的拟合(或表征)能力,即该网络模型的泛化能力很强,能较好地用于评价未知样本。
4.1.5分界样本的模型输出值
将分界值样本的各项污染指标值输入训练好的网络模型,对应的网络模型输出值分别为:1. 51、2. 48、3. 49、4. 47和5. 51。这样对应于Ⅰ—Ⅴ类和超Ⅴ类水质,其网络模型输出值的范围分别为:(0,1. 51)、(1. 51,2. 48)、(2 .48,3. 49)、(3. 49,4. 47)、(4. 47,5. 51)和>5 .51。
4.1.6辽河新民段水体水质类别的判定
将辽河新民段水体1994—1999年水体各污染指标的监测数据(表1所示)输入到训练好的网络模型,模型输出值分别为:3.65、3. 84、3. 62、3. 74、3 .72和3. 99,对照Ⅰ-Ⅴ类和超Ⅴ类水质模型输出值的范围,上述水体的水质均为Ⅳ类偏好,而且1994和1996年水质较好,1999年水质最差。