论文部分内容阅读
自20世纪70年代起,新出现和复出的流行病达40多种。霍乱、疟疾和肺结核这些绝迹或正在消除的流行病,在世界许多地方重新流行起来。地理可视化分析技术能够提供帮助专家用户理解流行病复杂数据集的图形界面,综合分析并生成健康地图及其他相关地理信息的表现形式,将数据的时间、空间及属性分布规律从图上表现出来,能直观的表示出数据的区域差异性。地学信息图谱理论则可借助遥感、地理信息系统、计算机等多种技术,进行图形和抽象概括,从而发掘其隐含的规律,并将图上的信息及规律按照一定的时间和空间排列起来,形成谱系,同时运用时空模型,建立动态变化规律,进一步开展预测与调控研究。因此,将地理可视化分析、地学信息图谱等理论和技术应用于流行病时空数据分析中,借其对多源多维数据的时空管理及图形表达上的优势,将流行病多维信息进行图形和抽象概括,利用时空模型综合分析流行病与环境、社会经济等的关系,对揭示其空间格局及演变规律有重要帮助,为流行病的研究提供空间技术分析和决策支持服务具有重要意义。 基于上述背景,本论文主要从以下几个方面展开研究: (1)基于地学信息图谱、地理信息系统等的理论技术基础,结合地理可视化、数据挖掘等分析方法,利用时序分析、叠加分析、时空聚类等模型,较为系统地研究了流行病时空信息图谱理论,构建了“数据-信息-方法-知识”为一体的流行病时空信息图谱分析框架。同时,基于维数组合的思路,即从时间、空间、属性多维中选取一维、二维或三维固定,另一维至多维延伸展示的基本方法,以时间一维、空间二维、时空三维等为参考坐标系,设计与实现流行病多维时空信息可视化与图谱分析方法。 (2)在空间二维坐标系下,以中国大陆地级市2007年年均肺结核发病率数据为例,结合空间数据可视化、叠加分析、回归分析等技术,从空间数据可视化、信息图谱、数据挖掘和知识图谱四个方面,对肺结核数据进行空间数据信息可视化与图谱分析。 (3)在一维时间轴下,以贵州省2005-2012年年均肺结核发病率数据为例,结合时序数据可视化、相关性分析以及时间序列分析等技术,从时序数据可视化、信息图谱、数据挖掘和知识图谱四个方面,对肺结核数据进行时序数据信息可视化与图谱分析。 (4)在时空三维空间坐标系下,以贵州省2005-2011年县区级年均肺结核发病率数据为例,结合时空数据可视化、叠加分析、贝叶斯分层模型等技术,从时空数据可视化、信息图谱、数据挖掘和知识图谱四个方面,对肺结核数据进行时空数据信息可视化与图谱分析。 (5)基于SOM聚类算法,建立了流行病特有的“人群”间性别、年龄、职业分布的多维属性可视化的高效聚类分析方法。 本论文的创新如下: (1)构建了融合征兆图、诊断图、知识图等的流行病时空信息图谱框架;从时-空数据处理、图/谱计算、统计分析及可视化等方面,提出了“数据-信息-方法-知识”为一体的流行病时空信息图谱分析方法。 (2)构建了流行病的时序、空间、时-空和多维属性数据可视化分析模式,设计了脸谱、气泡图等流行病可视化表达与制图方法,有效扩展了流行病时空分布数据与传播动态的表达方式。 (3)以肺结核为案例,提出了流行病“人间分布”(性别、年龄、职业等)多维属性数据的高效聚类分析方法,获得了具有参考价值的我国多时空尺度的肺结核分布特征。