论文部分内容阅读
洪水灾害是威胁人类生存与社会发展最主要的自然灾害之一,其中山洪灾害突发性强、破坏力大、成灾速度快、预测难度高,已经成为世界各国山丘区城市和乡村社会经济发展面临的重大问题,山洪灾害防御亦是我国防汛工作的难点和薄弱环节。山洪灾害预报预警研究能够为山洪灾害防御工作提供必要的科学支撑,构建适用于山丘区中小流域、预报精度高、适用能力强、计算简单且易于推广的洪水预报模型是山洪灾害预报预警研究的关键技术之一。本文针对山洪灾害预报预警及其与深度学习交叉学科研究面临的关键问题和技术难题,基于长短时记忆网络(LSTM)和深度学习堆叠架构,以我国江西省安和水文站控制流域为例,从适用于山丘区中小流域的洪水预报模型构建、机器学习洪水预报模型建模不确定性分析、机器学习洪水预报模型的可解释性三方面开展研究。在山洪灾害预报预警迫切的实际需求和深度学习技术爆发的时代背景下,本文研究工作对于提高山洪灾害预报预警方法的创新能力、人工智能技术应用水平具有一定的理论研究意义和工程应用价值。本文的主要研究内容和创新性成果如下:
(1)为更有针对性地构建适用于山丘区中小流域的机器学习洪水预报模型,本文对我国江西省安和水文站控制流域进行了水文特征分析。首先,介绍研究流域概况,审查并整编水文资料;然后,选取典型场次洪水并识别山丘区中小流域暴雨和洪水特征;最后,分别制定适用于机器学习模型评估、适用于机器学习模型建模不确定性分析以及同时适用于新安江模型和机器学习模型的样本集构建方案,确定符合山洪灾害预报预警实际需求的洪水预报评价指标和评定标准,为机器学习洪水预报模型构建、权重可视化分析、建模不确定性分析、特征因子影响分析以及记忆单元状态水文解释提供数据基础和建模准备。
(2)为解决山丘区中小流域洪水预报中常规流域水文模型难以兼顾预报精度和预见期的问题,本文提出适用于山丘区中小流域的LSTM洪水预报模型构建及权重可视化分析方法。首先,基于LSTM及其堆叠架构,建立LSTM单步输出洪水预报集合模型及其基准模型(BP单输出洪水预报集合模型);然后,分析两个模型对不同量级场次洪水的预报精度,对比两个模型在不同预见期的泛化能力,评估LSTM单步输出洪水预报集合模型的预报效果;最后,通过LSTM权重可视化分析,验证LSTM单步输出洪水预报集合模型内部计算符合产汇流计算的时序特征。该方法将水文特征分析融入了机器学习洪水预报模型建模过程,实现了山丘区中小流域短预见期大于预警流量场次洪水的高精度预报,洪峰流量大于预警流量场次洪水1~5h预见期的合格率在94.7%以上,6~10h预见期的合格率在84.2%~89.5%之间。
(3)针对已有机器学习洪水预报模型不确定性分析仅考虑单一建模因素影响的问题,本文提出机器学习时间序列预测模型建模不确定性量化及机器学习评估方法。首先,阐述机器学习建模过程中主要的三类不确定性来源,引入耦合二次抽样方法的方差分解理论,构建机器学习时间序列预测模型建模不确定性量化及评估框架;然后,依次统计各个建模不确定性因素组合方案在不同预见期下的模拟结果,明确多个不确定性来源条件下LSTM在机器学习洪水预报模型中的优势所在;最后,量化样本集划分方式、循环神经网络方法、深度学习堆叠架构及其交互作用在不同预见期、不同流量分位数上对径流模拟的不确定性贡献。该方法解析了多个建模因素对山丘区中小流域洪水预报结果的影响随预见期和流量量级变化的规律,弥补了机器学习方法评估无法考虑其他建模因素影响的缺陷。
(4)为解决已有机器学习模型可解释性分析方法难以验证机器学习洪水预报模型合理性的问题,本文提出了机器学习洪水预报模型特征因子影响分析方法。首先,在机器学习洪水预报模型建模不确定性分析基础上,建立LSTM多步输出洪水预报模型;然后,对比分析LSTM多步输出洪水预报模型与LSTM单步输出洪水预报集合模型在1~10h预见期的预报精度和泛化能力;最后,设计特征因子影响分析研究方案,分离不同预见期下降雨特征因子、径流特征因子以及二者交互作用在洪水过程中对输出流量的作用,分析两类特征因子作用随洪水过程变化的特点。该方法揭示出降雨特征因子作用与降雨过程在时间上保持一致,径流特征因子作用与模拟径流的预见期保持一致,LSTM多步输出洪水预报模型能够挖掘出降雨空间分布对洪水过程的影响规律,但其并未遵循水文学中的水量平衡原理。
(5)针对机器学习洪水预报模型无法从水文学角度解释模型结构和模型参数的问题,本文提出基于深度学习堆叠架构的LSTM概念性洪水预报模型构建及其水文学解释方法。首先,将概念性水文模型的模型结构、多降雨特征因子的输入优势、LSTM处理长期依赖问题的强大能力融入深度学习堆叠架构设计,建立LSTM概念性洪水预报模型,通过对比分析新安江模型和Simple RNN,检验和评估LSTM概念性洪水预报模型的预报效果;然后,提取LSTM概念性洪水预报模型和新安江模型的状态变量,阐明LSTM概念性洪水预报模型结构和记忆单元状态的水文学含义;最后,提出基于LSTM的山丘区小流域洪水预报组合方法。LSTM概念性洪水预报模型取得了优于新安江模型的预报效果,为水文模拟研究和水文预报方法提供了全新的建模思路,组合预报实现了山丘区小流域1~10h预见期大于预警流量场次洪水洪峰的高精度预报(合格率在94.7%以上)。
(1)为更有针对性地构建适用于山丘区中小流域的机器学习洪水预报模型,本文对我国江西省安和水文站控制流域进行了水文特征分析。首先,介绍研究流域概况,审查并整编水文资料;然后,选取典型场次洪水并识别山丘区中小流域暴雨和洪水特征;最后,分别制定适用于机器学习模型评估、适用于机器学习模型建模不确定性分析以及同时适用于新安江模型和机器学习模型的样本集构建方案,确定符合山洪灾害预报预警实际需求的洪水预报评价指标和评定标准,为机器学习洪水预报模型构建、权重可视化分析、建模不确定性分析、特征因子影响分析以及记忆单元状态水文解释提供数据基础和建模准备。
(2)为解决山丘区中小流域洪水预报中常规流域水文模型难以兼顾预报精度和预见期的问题,本文提出适用于山丘区中小流域的LSTM洪水预报模型构建及权重可视化分析方法。首先,基于LSTM及其堆叠架构,建立LSTM单步输出洪水预报集合模型及其基准模型(BP单输出洪水预报集合模型);然后,分析两个模型对不同量级场次洪水的预报精度,对比两个模型在不同预见期的泛化能力,评估LSTM单步输出洪水预报集合模型的预报效果;最后,通过LSTM权重可视化分析,验证LSTM单步输出洪水预报集合模型内部计算符合产汇流计算的时序特征。该方法将水文特征分析融入了机器学习洪水预报模型建模过程,实现了山丘区中小流域短预见期大于预警流量场次洪水的高精度预报,洪峰流量大于预警流量场次洪水1~5h预见期的合格率在94.7%以上,6~10h预见期的合格率在84.2%~89.5%之间。
(3)针对已有机器学习洪水预报模型不确定性分析仅考虑单一建模因素影响的问题,本文提出机器学习时间序列预测模型建模不确定性量化及机器学习评估方法。首先,阐述机器学习建模过程中主要的三类不确定性来源,引入耦合二次抽样方法的方差分解理论,构建机器学习时间序列预测模型建模不确定性量化及评估框架;然后,依次统计各个建模不确定性因素组合方案在不同预见期下的模拟结果,明确多个不确定性来源条件下LSTM在机器学习洪水预报模型中的优势所在;最后,量化样本集划分方式、循环神经网络方法、深度学习堆叠架构及其交互作用在不同预见期、不同流量分位数上对径流模拟的不确定性贡献。该方法解析了多个建模因素对山丘区中小流域洪水预报结果的影响随预见期和流量量级变化的规律,弥补了机器学习方法评估无法考虑其他建模因素影响的缺陷。
(4)为解决已有机器学习模型可解释性分析方法难以验证机器学习洪水预报模型合理性的问题,本文提出了机器学习洪水预报模型特征因子影响分析方法。首先,在机器学习洪水预报模型建模不确定性分析基础上,建立LSTM多步输出洪水预报模型;然后,对比分析LSTM多步输出洪水预报模型与LSTM单步输出洪水预报集合模型在1~10h预见期的预报精度和泛化能力;最后,设计特征因子影响分析研究方案,分离不同预见期下降雨特征因子、径流特征因子以及二者交互作用在洪水过程中对输出流量的作用,分析两类特征因子作用随洪水过程变化的特点。该方法揭示出降雨特征因子作用与降雨过程在时间上保持一致,径流特征因子作用与模拟径流的预见期保持一致,LSTM多步输出洪水预报模型能够挖掘出降雨空间分布对洪水过程的影响规律,但其并未遵循水文学中的水量平衡原理。
(5)针对机器学习洪水预报模型无法从水文学角度解释模型结构和模型参数的问题,本文提出基于深度学习堆叠架构的LSTM概念性洪水预报模型构建及其水文学解释方法。首先,将概念性水文模型的模型结构、多降雨特征因子的输入优势、LSTM处理长期依赖问题的强大能力融入深度学习堆叠架构设计,建立LSTM概念性洪水预报模型,通过对比分析新安江模型和Simple RNN,检验和评估LSTM概念性洪水预报模型的预报效果;然后,提取LSTM概念性洪水预报模型和新安江模型的状态变量,阐明LSTM概念性洪水预报模型结构和记忆单元状态的水文学含义;最后,提出基于LSTM的山丘区小流域洪水预报组合方法。LSTM概念性洪水预报模型取得了优于新安江模型的预报效果,为水文模拟研究和水文预报方法提供了全新的建模思路,组合预报实现了山丘区小流域1~10h预见期大于预警流量场次洪水洪峰的高精度预报(合格率在94.7%以上)。