面向复杂时空数据的可视查询与分析方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:simon746cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着传感器技术的发展和智能设备的普及,各行各业收集获取了海量的时空数据,它们通常记录了数据对象的时间、空间和其他各类多元属性信息和特征。以数据挖掘、人工智能技术为基础的时空数据分析技术迅速成为科研、应用领域的热门课题,并被广泛地应用于诸如城市规划决策,交通监督管理,人群行为模式分析等应用场景中。然而,由于时空数据的多源异构性和分析任务的复杂多样性,使得现阶段的数据的管理和分析面临了诸多挑战。可视查询与可视分析作为近年来蓬勃发展的技术,可以结合人类强大的视觉感知能力和计算机的数据处理能力,帮助用户快速过滤获取感兴趣的数据子集、直观检查数据的属性信息并发现其蕴藏的重要数据特征,在时空数据的数据展示,知识发现和探索分析的过程中起到了重要作用。
  大规模时空数据的采集在给以数据为驱动的智能应用带来新机遇的同时,也给数据的可视查询与可视分析带来了新的挑战。一方面,各个领域的用户期望能够借助于可视查询系统自然、便捷地表达数据查询和分析需求,构建并迭代式的调整分析流程,完成融合多数据源数据的复杂、多样的数据分析任务。另一方面,现阶段多源时空数据的属性具有高维度、异构性、难以理解的特征,因此可视化方法需要将数据直观高效的呈现给用户,帮助用户探索数据中蕴藏的数据知识和数据特征。然而,已有的可视查询和分析技术还不足以支持多源异构时空数据的检索、推理和分析,现有的交互分析方法不足以支持分析需求的自然表达,查询条件的准确定义,时空数据信息的渐进式、迭代式探索。
  本文提出了多源异构时空数据的可视查询新模式,解决了不同领域用户对跨数据源数据的复杂查询、推理、分析任务,其迭代式递进式的数据查询和推理策略填补了现有跨数据源数据融合分析技术的空白。在此基础上,我们以城市场景为应用背景,提出了一系列可视查询与可视分析系统中的关键技术,解决了现阶段时空数据分析所面临的三个重要挑战:一种面向海量时空数据的自然语言可视查询方法,解决了因时空数据体量大、语义复杂、查询条件输入繁琐而导致的分析需求表达困难和数据时空、语义信息分析困难;一种面向不确定时空数据的可视分析方法,解决了具有属性不确定性的时空数据分析困难;一种面向时空数据隐私保护的可视查询与分析方法,解决了针对具有隐私信息的时空数据的实时数据匿名化、数据检索和数据展示困难。本文主要研究内容如下:
  ?面向多源异构时空数据的可视查询新模式:总结多源异构时空数据的属性特征,建立数据存储及管理模型,并设计了支持复杂跨域时空数据融合分析的查询推理模型。基于该模型,本研究实现了一个基于城市中真实多源异构时空数据集的可视查询推理系统。其通过河流式的查询视图帮助用户输入查询条件,构建跨数据源的复杂分析流程,通过地图视图展示查询结果的属性特征和地理上下文信息,完成迭代式、递进式的数据检索、推理、分析任务。
  ?面向海量时空数据的自然语言可视查询方法:针对城市场景中的大规模轨迹数据,设计并实现了一个支持自然语言输入的可视查询系统。本研究通过POI数据获取了每个轨迹点所在地理区域的地理上下文信息和轨迹点的语义信息,并以此实现了轨迹的文本化。然后通过结合自然语言处理算法和概率搜索模型的自然语言搜索引擎,接受用户的自然语言输入并获取与输入的查询语句相关性最高的轨迹数据。最后通过可视分析界面实现查询条件的展示、调整,轨迹数据的时空、语义等多元属性信息的分析、探索。
  ?面向不确定时空数据的可视分析方法:本研究针对数据不确定性引起的数据展示与数据分析困难,以分级统计地图为例,提出了一套面向具有属性不确定性的时空数据可视分析方法,帮助用户研究时空数据中不同地理单元、不同等级的数据不确定性对数据计算和可视化结果造成的影响情况。其包含一套假设-模拟-比较的迭代式可视分析流程,帮助用户比较不同数据值生成的数据计算和可视化结果之间的差异,从而更深刻的理解数据的不确定性。
  ?面向时空数据隐私保护的可视查询与分析方法:现有的时空数据可视查询与分析方法几乎都没有考虑数据隐私保护的问题,缺少一种能够对查询结果高效实时匿名化的方法,也缺少一种考虑数据隐私性的数据可视化方法。本研究提出了一个基于图结构的时空数据抽象表达方法,基于此实现了任意时空数据子集的实时匿名化处理过程。本研究还设计了一个能够保护数据隐私信息的可视分析界面,在展示数据分布特征和属性信息的同时,保护个人敏感位置信息,展示由于隐私保护算法所带来的数据缺失、改变的情况,帮助用户平衡数据匿名后的可用性和隐私性。
其他文献
学位
学位
该文利用神经网络技术检验数据初期处理算法对预测效果的影响,提出了三种数据前期处理算法的改进方法:(1)收盘价5日涨跌比;(2)成交量5日均值法;(3)日均价法.该文首先针对股票预测广泛的社会需求,概述了股票预测的技术现状、常用分析方法,以及传统预测方法面临的问题;其次,综合比较了改进的BP算法和径向基函数法、回溯期改变以及输入矢量差别对预测结果的影响,确定了一个结构和性能良好的神经网络,能够减少外
学位
物流规划由于在现实世界的大量应用一直受到广泛关注。现实世界的物流规划问题中存在着许多动态、随机的变化,因此不确定环境下的物流规划问题成为了物流领域的研究热点。进化算法能有效解决许多物流规划问题,因而研究者提出了许多进化算法来解决不确定环境下的物流规划问题。然而,这些进化算法在应对一些不确定环境下物流规划问题时的性能、效率方面仍存在不足。为此,本文针对性地提出了多种有效的新型进化算法来求解两类典型的
学位
动态图数据在现实生活中十分普遍,科研合作网络、家谱树、足球传球网络、社交媒体网络,都可以被建模成动态图数据。分析这类数据的演变规律可以帮助领域专家发现潜在的有用信息。然而随着数据的累积,动态图数据中包含着大量的图结构信息和复杂的时序变化,这给领域专家识别有用信息,分析潜在的演变模式和特征结构带来了极大的挑战。如何解决动态图数据结构复杂、数量巨大、长度不定的问题,有效地提取动态图数据中的演变模式,总
室内场景重建问题是计算机视觉中的一个重要研究课题,其所得到的场景稠密三维模型在很多领域都有重要应用,例如室内场景的三维模型作为地图可以辅助机器人进行路径导航以及避障、稠密的三维场景重建结果作为输入可以解决传统目标识别、跟踪以及检测方法无法解决的场景遮挡问题等等。近年来随着消费级深度相机的不断普及,基于RGB-D数据的室内场景重建越来越受到关注。虽然在科研人员不懈努力下,三维重建算法已经取得了长足的
更高的准确度与计算效率一直是基于物理的仿真所追求的终极目标。近年来针对特定问题开发的高效算法和高速发展的计算能力共同推动了物理仿真的发展,然而实际应用中物理仿真所需求的计算资源和时间成本往往还是会超出预算。因而实践中不得不在速度和准确度之间做一定取舍,比如降低仿真规模、算法复杂程度等来换取更好的运行性能。与此同时,处理器速度与存储容量的增长推动着计算能力的爆炸式增长,而相比之下,时钟频率和存储访问
学位
近三十年来,布料仿真一直是计算机图形学领域最热门的研究方向之一。针对布料仿真的各个阶段(布料模型、时间积分、拉伸限制、碰撞处理等)出现的不足,研究者做了大量研究,并取得了很好的成果。目前,基于物理的布料仿真已经可以生成高真实感的布料形态,并广泛应用于服装设计、电影、游戏等领域。其中,以虚拟试衣镜为代表的实时虚拟试衣应用一直吸引着科研界和工业界的目光,数款虚拟试衣系统被相继推出,但大多缺乏动态性和真
数字化口腔诊疗技术的发展,使得患者信息采集、治疗方案设计、治疗效果评估等诊疗环节更加全面、准确且安全。使用光学成像设备和锥形束计算机断层扫描成像(Cone beam CT,CBCT)设备可以快速获取患者的三维网格数据和CBCT图像数据。通过观察患者医学数据中的相关组织结构,医生可以实施更为有效和个性化的治疗。如何从患者的医学数据中抽取得到有助于临床诊疗的组织结构信息,是数字口腔技术应用发展的关键。
学位
作为机器学习的一个重要分支,强化学习是一类在线学习的方法,其目的是最大化与环境交互所获得的长远回报。近年来,强化学习领域的研究取得了长足的进展,在机器人控制、游戏与博弈、仿真模拟、调度与优化等领域取得了广泛的应用。然而,现有强化学习方法仍面临着一些挑战。相比于其他类型的机器学习方法,强化学习的样本数据利用率往往较为低下,针对一些高维空间问题时探索效率不高,以及算法健壮性差等。本文从强化学习的样本数
学位