论文部分内容阅读
海域水体叶绿素-a(Chl-a)浓度是衡量海洋初级生产力的重要指标,也是衡量海域水体富营养化的关键指标,其演变规律反映了海水理化性质动态变化的规律。因此,对Chl-a浓度的预测分析对发现水体理化性质的演变、预防水体富营养化现象、保护海洋生态环境及保障沿岸海洋农业的发展都具有重要意义。目前已有的相关研究偏重于水体Chl-a浓度与水环境的关联性分析,对水体Chl-a浓度的预测研究也主要面向河流、湖泊等非海域环境,缺乏针对近岸海域Chl-a浓度的预测方法。本文以近岸海域环境监测数据集为研究对象,采用集成学习方法,通过对近岸海域环境监测数据的时空特征、理化特征和水文、气象特征等自然因素,以及海域功能区划、陆源排放等人为因素对近岸海域Chl-a浓度的影响进行综合分析研究,实现了对近岸海域Chl-a浓度的时空分布预测。本文的主要工作包括:(1)给出面向海洋环境监测数据的预处理方法,包括原始数据预处理、特征构造及特征处理三个步骤,其中,原始数据预处理包括数据去重、下采样、插补及归一化,特征构造包括特征简化和特征组合,特征处理包括特征重组和特征重要性分析。(2)提出基于聚类-回归堆叠的近岸海域Chl-a浓度时空分布预测方法,首先对监测数据进行K-means聚类,根据聚类结果将近岸海域划分为七类分区,每类分区中具有相近的Chl-a浓度演变特征;然后在每个分区,基于KNN、MLP、SVR、XGBoost和RF的回归堆叠模型,实现Chl-a浓度的季节性预测。(3)提出基于KNN-LSTM的Chl-a浓度时空分布预测方法,首先结合欧氏距离与KNN算法筛选与当前目标监测站位具有最相近特征关联的监测站点,形成预测区域,然后以各监测站的环境因子所构成的时间序列作为训练数据,应用LSTM网络模型实现了近岸海域Chl-a浓度的时空分布预测。本文采用2015年至2018年威海近岸海域环境监测数据集为实验数据,通过实验验证了所提出的模型和方法对近岸海域Chl-a浓度时空分布预测的有效性。