论文部分内容阅读
近年来,随着传感器技术的发展和智能设备的普及,各行各业收集获取了海量的时空数据,它们通常记录了数据对象的时间、空间和其他各类多元属性信息和特征。以数据挖掘、人工智能技术为基础的时空数据分析技术迅速成为科研、应用领域的热门课题,并被广泛地应用于诸如城市规划决策,交通监督管理,人群行为模式分析等应用场景中。然而,由于时空数据的多源异构性和分析任务的复杂多样性,使得现阶段的数据的管理和分析面临了诸多挑战。可视查询与可视分析作为近年来蓬勃发展的技术,可以结合人类强大的视觉感知能力和计算机的数据处理能力,帮助用户快速过滤获取感兴趣的数据子集、直观检查数据的属性信息并发现其蕴藏的重要数据特征,在时空数据的数据展示,知识发现和探索分析的过程中起到了重要作用。
大规模时空数据的采集在给以数据为驱动的智能应用带来新机遇的同时,也给数据的可视查询与可视分析带来了新的挑战。一方面,各个领域的用户期望能够借助于可视查询系统自然、便捷地表达数据查询和分析需求,构建并迭代式的调整分析流程,完成融合多数据源数据的复杂、多样的数据分析任务。另一方面,现阶段多源时空数据的属性具有高维度、异构性、难以理解的特征,因此可视化方法需要将数据直观高效的呈现给用户,帮助用户探索数据中蕴藏的数据知识和数据特征。然而,已有的可视查询和分析技术还不足以支持多源异构时空数据的检索、推理和分析,现有的交互分析方法不足以支持分析需求的自然表达,查询条件的准确定义,时空数据信息的渐进式、迭代式探索。
本文提出了多源异构时空数据的可视查询新模式,解决了不同领域用户对跨数据源数据的复杂查询、推理、分析任务,其迭代式递进式的数据查询和推理策略填补了现有跨数据源数据融合分析技术的空白。在此基础上,我们以城市场景为应用背景,提出了一系列可视查询与可视分析系统中的关键技术,解决了现阶段时空数据分析所面临的三个重要挑战:一种面向海量时空数据的自然语言可视查询方法,解决了因时空数据体量大、语义复杂、查询条件输入繁琐而导致的分析需求表达困难和数据时空、语义信息分析困难;一种面向不确定时空数据的可视分析方法,解决了具有属性不确定性的时空数据分析困难;一种面向时空数据隐私保护的可视查询与分析方法,解决了针对具有隐私信息的时空数据的实时数据匿名化、数据检索和数据展示困难。本文主要研究内容如下:
?面向多源异构时空数据的可视查询新模式:总结多源异构时空数据的属性特征,建立数据存储及管理模型,并设计了支持复杂跨域时空数据融合分析的查询推理模型。基于该模型,本研究实现了一个基于城市中真实多源异构时空数据集的可视查询推理系统。其通过河流式的查询视图帮助用户输入查询条件,构建跨数据源的复杂分析流程,通过地图视图展示查询结果的属性特征和地理上下文信息,完成迭代式、递进式的数据检索、推理、分析任务。
?面向海量时空数据的自然语言可视查询方法:针对城市场景中的大规模轨迹数据,设计并实现了一个支持自然语言输入的可视查询系统。本研究通过POI数据获取了每个轨迹点所在地理区域的地理上下文信息和轨迹点的语义信息,并以此实现了轨迹的文本化。然后通过结合自然语言处理算法和概率搜索模型的自然语言搜索引擎,接受用户的自然语言输入并获取与输入的查询语句相关性最高的轨迹数据。最后通过可视分析界面实现查询条件的展示、调整,轨迹数据的时空、语义等多元属性信息的分析、探索。
?面向不确定时空数据的可视分析方法:本研究针对数据不确定性引起的数据展示与数据分析困难,以分级统计地图为例,提出了一套面向具有属性不确定性的时空数据可视分析方法,帮助用户研究时空数据中不同地理单元、不同等级的数据不确定性对数据计算和可视化结果造成的影响情况。其包含一套假设-模拟-比较的迭代式可视分析流程,帮助用户比较不同数据值生成的数据计算和可视化结果之间的差异,从而更深刻的理解数据的不确定性。
?面向时空数据隐私保护的可视查询与分析方法:现有的时空数据可视查询与分析方法几乎都没有考虑数据隐私保护的问题,缺少一种能够对查询结果高效实时匿名化的方法,也缺少一种考虑数据隐私性的数据可视化方法。本研究提出了一个基于图结构的时空数据抽象表达方法,基于此实现了任意时空数据子集的实时匿名化处理过程。本研究还设计了一个能够保护数据隐私信息的可视分析界面,在展示数据分布特征和属性信息的同时,保护个人敏感位置信息,展示由于隐私保护算法所带来的数据缺失、改变的情况,帮助用户平衡数据匿名后的可用性和隐私性。
大规模时空数据的采集在给以数据为驱动的智能应用带来新机遇的同时,也给数据的可视查询与可视分析带来了新的挑战。一方面,各个领域的用户期望能够借助于可视查询系统自然、便捷地表达数据查询和分析需求,构建并迭代式的调整分析流程,完成融合多数据源数据的复杂、多样的数据分析任务。另一方面,现阶段多源时空数据的属性具有高维度、异构性、难以理解的特征,因此可视化方法需要将数据直观高效的呈现给用户,帮助用户探索数据中蕴藏的数据知识和数据特征。然而,已有的可视查询和分析技术还不足以支持多源异构时空数据的检索、推理和分析,现有的交互分析方法不足以支持分析需求的自然表达,查询条件的准确定义,时空数据信息的渐进式、迭代式探索。
本文提出了多源异构时空数据的可视查询新模式,解决了不同领域用户对跨数据源数据的复杂查询、推理、分析任务,其迭代式递进式的数据查询和推理策略填补了现有跨数据源数据融合分析技术的空白。在此基础上,我们以城市场景为应用背景,提出了一系列可视查询与可视分析系统中的关键技术,解决了现阶段时空数据分析所面临的三个重要挑战:一种面向海量时空数据的自然语言可视查询方法,解决了因时空数据体量大、语义复杂、查询条件输入繁琐而导致的分析需求表达困难和数据时空、语义信息分析困难;一种面向不确定时空数据的可视分析方法,解决了具有属性不确定性的时空数据分析困难;一种面向时空数据隐私保护的可视查询与分析方法,解决了针对具有隐私信息的时空数据的实时数据匿名化、数据检索和数据展示困难。本文主要研究内容如下:
?面向多源异构时空数据的可视查询新模式:总结多源异构时空数据的属性特征,建立数据存储及管理模型,并设计了支持复杂跨域时空数据融合分析的查询推理模型。基于该模型,本研究实现了一个基于城市中真实多源异构时空数据集的可视查询推理系统。其通过河流式的查询视图帮助用户输入查询条件,构建跨数据源的复杂分析流程,通过地图视图展示查询结果的属性特征和地理上下文信息,完成迭代式、递进式的数据检索、推理、分析任务。
?面向海量时空数据的自然语言可视查询方法:针对城市场景中的大规模轨迹数据,设计并实现了一个支持自然语言输入的可视查询系统。本研究通过POI数据获取了每个轨迹点所在地理区域的地理上下文信息和轨迹点的语义信息,并以此实现了轨迹的文本化。然后通过结合自然语言处理算法和概率搜索模型的自然语言搜索引擎,接受用户的自然语言输入并获取与输入的查询语句相关性最高的轨迹数据。最后通过可视分析界面实现查询条件的展示、调整,轨迹数据的时空、语义等多元属性信息的分析、探索。
?面向不确定时空数据的可视分析方法:本研究针对数据不确定性引起的数据展示与数据分析困难,以分级统计地图为例,提出了一套面向具有属性不确定性的时空数据可视分析方法,帮助用户研究时空数据中不同地理单元、不同等级的数据不确定性对数据计算和可视化结果造成的影响情况。其包含一套假设-模拟-比较的迭代式可视分析流程,帮助用户比较不同数据值生成的数据计算和可视化结果之间的差异,从而更深刻的理解数据的不确定性。
?面向时空数据隐私保护的可视查询与分析方法:现有的时空数据可视查询与分析方法几乎都没有考虑数据隐私保护的问题,缺少一种能够对查询结果高效实时匿名化的方法,也缺少一种考虑数据隐私性的数据可视化方法。本研究提出了一个基于图结构的时空数据抽象表达方法,基于此实现了任意时空数据子集的实时匿名化处理过程。本研究还设计了一个能够保护数据隐私信息的可视分析界面,在展示数据分布特征和属性信息的同时,保护个人敏感位置信息,展示由于隐私保护算法所带来的数据缺失、改变的情况,帮助用户平衡数据匿名后的可用性和隐私性。