论文部分内容阅读
大气污染物受地理环境、气候条件和人类活动等多重因素的影响可以被看成一个复杂系统。该复杂系统中既有污染物时间演化过程中的相关性,也有区域之间污染物组成和结构上的相似性。理解污染物系统的多层次,多维度的复杂性对于治理大气污染具有重要的指导意义,本博士论文从复杂系统的视角研究了大气污染过程中的时空相关性特征。 本文以中国大陆350个城市在2015年的六种污染物实时浓度和空气质量指数(Air Quality Index,AQI)作为研究样本,探索了大气污染的整体特征和局部特征。发现区域间存在不平衡性,并且东西差异性明显,京津冀地区的污染严重。从季节特征上看,一年中以冬季污染物较为严重,以夏季和秋季大气污染较轻。并采用降趋移动平均的方法分析了各城市的污染物浓度的长程相关性,发现六种污染物都具有显著的长程相关性,其中以PM2.5和PM10的长程相关性最强,O3的长程相关性最弱。并据此解释了污染天气接踵而至的原因。文章其次对六种污染物的小时数据进行了城市相关性分析。发现在所有的污染物中,O3的整体相关性程度是最高的;各种污染物具有很强的地域性特征,并采用了平面最大过滤图(Planar Maximally Filtering Graph,PMFG)方法构造了相关性网络并且分析了网络的结构单元-3元团和4元团的结构特征和空间分布,发现PMFG能够很好地提取相关矩阵中的有关信息,城市间的相关性结构在PMFG上也能够较好体现。通过挖掘PMFG单元结构发现成为团结构的城市或有着相似的工业结构或有着共同的污染源。并采用有向冒泡层次树算法(Directed Bubble Hierarchy Tree,DBHT)的方法对PMFG网络进行社团聚类,发现根据CO和SO2构建的社团数目最少,只有其他几种污染物社团数目的一半。文章接着从主成分分析和随机矩阵的角度研究区域相关性特征,发现在污染物相关性矩阵中,第一主成分占到了总体的24%到46%不等;采用随机矩阵理论的方法发现大约86%的特征值是非随机化的,并且对比了不同的数据集下,不同污染物的最大特征值,最小特征值以及超过预测值范围的特征值比例,进一步量化说明了实证特征值的信息量。通过特征组合的方法构建了Ⅰ综合指数,发现这种指数能够代表污染物全国层面的总体水平。随后本文通过研究相关性系数与空间距离的关系发现随着距离的增大,相关系数衰变的速度对于每个城市都是不同的。这种差异性在东经100度两边表现明显,很好地符合了中国的城市和人口的分布特征。发现元团结构间的相关系数与距离的关系要比元团结构内的相关系数与距离的关系明显,发现两个城市的人口经济社会指标相差越大,相关系数越小。并且发现距离衰变的系数r大约在-0.10左右。从对相关系数影响的程度来看,人口密度的影响程度强于人口的影响程度,强于GDP的影响程度,强于人均GDP的影响程度。本文还在AQI的基础上采用Markov状态转移方法研究了上海、北京、广州、天津和重庆五个主要城市的日度AQI和实时AQI演化特征。对比了均值方差模型和自回归模型下这五个城市AQI结构的区别。发现常数转移概率矩阵下的MRS模型成功分离出来大气波动率特征。五个城市中,北京、上海和天津的波动率较高的时间要比其余两个城市高。当采用时变转移概率时,不仅能够分辨出不同波动率下的AQI特征,还能对均值部分,自回归的一阶滞后部分作出区分。文章正文最后整合了风险测度领域的重现时间间隔(Recurrence Interval Analysis,RIA)和自回归条件久期(Autoregressive Conditional Duration,ACD)两个模型,并将其扩展到空间自回归条件久期(Spatial Autoregressive Conditional Duration,SACD),并将其运用于大气污染的极端风险预测中。采用2013年到2016年北京市的12个观测站点作为测试样本,发现RIA和ACD这种整合对于预测极端条件下的重现时间间隔是有效的,加入空间回顾重现时间间隔能够提升其预测力,但提升效果并不是十分显著。采用了ACD(1,1,1)和SACD(1,1,1)模型进行样本外的测试,发现96%的预测值与真实值的差距都在72小时内。更加强化了RIA-ACD模型的解释力和预测力。最后在一阶滞后和最相邻站点的基础上拓展到多阶滞后和多个相邻的站点,发现了总体预测能力随时间阶数和空间距离增大而下降的趋势。 论文贯穿了时间维度和空间维度的演化动力学特征,采用实证数据分析的方法研究了大气污染物的特征,对于相关的政策制定者和利益相关者提供了认知污染规律的良好途径,也为从管理科学领域防治污染提供了新思路。