论文部分内容阅读
随着城市化进程的加快,河道污染问题日益突出,为有效防控河道污染,有必要做到末端治理和源头监控。目前,城市河道水质监测设施日趋实时化和智能化,为河道污染事件的监控奠定了基础。但通常的监测站及其监测系统,大多仅利用常规水质监测指标从酸碱度、浊度以及有机物含量等角度较单一地分析水质状况,尚较少地对水质异常类别与污染诱因(污染源类别)等进行综合判别。源于该背景,本文重点研究了利用监测站若干常规水质监测指标推断水质异常时污染源类别的方法,着重开展了常规水质指标对不同污染源响应特性的分析、河道水质异常时污染源的初步判别、低浓度污染情况下的污染源判别方法优化以及污染源判别原型系统的研发实现等工作,并利用实测污染源数据进行了方法验证。论文的主要工作和创新点如下所示:(1)研究了常规水质指标对不同污染源的响应特性。以常见的河道污染源为研究对象,研究了常规水质指标(如电导率、pH、浊度等)对不同类别水样的响应特点,分析不同污染源所引起的常规水质指标及其组合变化的特异性和规律性,为后续的污染源判别工作打下基础。(2)研究了基于常规水质指标的污染源类别判别方法。针对水质数据受多种外因干扰、多指标联合响应规律不显著等问题,提出了一种基于信息熵和梯度提升树的特征提取方法。引入信息熵对各水质指标进行粗粒度的离散化操作,使得模型关注指标所处区间而非指标具体取值,从而对噪声更具鲁棒性;采用梯度提升树挖掘多元指标组合和污染源类别间的非线性关联,进行细粒度的组合特征提取,并使特征间具有一定区分性和独立性。结合能够输出类别概率且具有较强解释性的逻辑回归算法和对小样本数据有较好分类性能的支持向量机算法,进行了污染源大类的判别。对比分析了采用不同特征提取方法时的模型性能,结果表明,本文所研究的方法能更好地对工业废水、生活污水以及咸潮等类型污染源进行判别,较好地实现了中高浓度污染情况下对污染源类别的快速判别。(3)研究了低浓度污染情况下污染源判别优化方法。针对低浓度污染情况下水质指标值与正常值差异不明显导致正常、异常特征不易区分的问题,对污染源判别方法进行了改进优化。在特征提取过程中,增加了对污染程度变化不敏感的余弦距离特征,并引入基于因子分解机和神经网络的DeepFM判别方法,以改善判别模型的泛化能力。通过正常河道水和高浓度污染水样按不同体积比混合得到不同污染程度的水样,将其作为测试集对比分析了判别模型优化前后对不同污染程度水样的判别性能,结果表明,优化后的判别模型可有效提高低浓度污染情况下的判别准确率,在实际河道低浓度污染场景中更具适用性。在此基础上,设计开发了河道水质污染源判别原型系统,介绍了该系统的总体架构与部分界面。基于污水厂水质监测数据进行了实例应用,分别从模型的训练样本量维度和训练周期维度讨论了各污染源判别方法的性能优势和适用场景,进一步验证了 DeepFM判别模型更适用于小训练样本量应用场景,逻辑回归判别模型更适用长迭代周期场景下的污染源判别。