【摘 要】
:
随着互联网经济的快速发展和移动终端的普及,基于位置的服务迅猛发展,与此同时,随着路网的不断发展和完善,路网中带有位置信息的对象迅速增加,在大规模路网中高效地查询给定两个顶点的最短距离成为数据库界研究热点。为了实现路网中的相关查询,人们提出了一些创新性的索引技术,例如:G-tree和G*-tree,它们对路网空间按区域进行划分,然后采用树形结构进行组织。尽管现有的技术能对路网进行有效划分和组织,但是
论文部分内容阅读
随着互联网经济的快速发展和移动终端的普及,基于位置的服务迅猛发展,与此同时,随着路网的不断发展和完善,路网中带有位置信息的对象迅速增加,在大规模路网中高效地查询给定两个顶点的最短距离成为数据库界研究热点。为了实现路网中的相关查询,人们提出了一些创新性的索引技术,例如:G-tree和G*-tree,它们对路网空间按区域进行划分,然后采用树形结构进行组织。尽管现有的技术能对路网进行有效划分和组织,但是查询效率还有进一步提升的空间。例如,hub-labeling 方法处理大规模路网中的最短距离查询问题时需要耗费大量的时间和内存资源,方可实现对标签信息的处理。通过调研发现,已有的最短距离查询处理方法不能有效的满足用户在大规模路网中的查询操作。因此,本文研究了大规模路网空间中的最短距离查询问题,设计了新颖的索引结构LG-tree和对应的查询算法。考虑到空间文本对象的不断累计,基于空间关键字查询的应用不断增加,本文以LG-tree为基础,设计了路网中空间文本对象的索引结构TLG-tree,并设计了对应的空间文本查询算法。本文的主要工作如下:第一、为了实现在大规模路网中的最短距离查询,受图分割技术和标签技术的启发,以G-tree为基础结构,本文提出了高效的LG-tree索引结构。该索引的构建思路如下:使用图分割技术对大图进行有效的分割,确定所有的边界顶点,并为这些边界点划分层次,添加标签信息。通过边界点的标签信息,可以快速确定各子图之间的最短距离。为了防止边界顶点层级划分的过高,提出了 N-level层级划分方法。为了进一步减少距离查询时的计算量,LG-tree的每个叶子节点都配有一个DIF倒排文件。DIF存储了当前节点的所有子节点的边界点间的最短距离信息。第二、基于提出的LG-tree索引结构,本文提出了基于动态规划的最短距离查询算法。根据查询点和目标点的位置关系,合理的选择不同的查询策略。本文扩展了 LG-tree的标签信息,实现最短距离的查询。通过多组对比实验,说明了查询算法的有效性和高效率。第三、考虑到路网中的空间对象携带了越来越多的文本信息,空间文本对象应运而生,基于LG-tree结构,本文研究了路网中的空间关键字查询问题,设计了新的相似度函数和空间文本索引TLG-tree,并且基于TLG-tree,提出了 CM算法,查询路网中的前k个空间文本对象。实验结果表明,CM算法是有效的。
其他文献
学习分析中学习者的学业成绩预测有利于教师进行教学决策,并采取教学干预以提升学生成绩。当前该领域主要是通过学习者的人口学信息和行为特征来预测学业成绩,忽略了文本数据所蕴含的情感与学业成绩之间的关系。因此,本文尝试利用学习情感进行学业成绩预测。具体而言,本文首先识别文本所蕴含的情感极性,然后从情感角度来预测学业成绩。为提升情感识别准确性,本文加入与学习行为相关的主题文本,包含“教师授课”、“获得证书”
文本关键词抽取是从文本中把能代表该文本内容的词或短语抽取出来的一种自然语言处理技术,它是自然语言处理领域较为重要的一个研究方向,在信息检索、图书馆学、情报学等领域都有重要的实际应用价值。尤其是进入二十一世纪,随着移动互联网等信息技术的快速发展,文本类型的数据呈现出指数增长的态势。对于企业和一些组织而言,这些文本数据具有极大的潜在应用价值,然而如何快速理解、利用这些文本数据是当前企业面临的一个重大实
随着自然语言处理的发展,开放领域的问答成为越来越重要的研讨课题,它基于用户的自然语言提问,从大批候选文本中精准地找到答案,而面向开放领域问答系统的机器阅读理解技术成为其中的一个热门研究方向。机器能够更准确的理解人类文本语言,从而去构建开放领域的问答系统、自动化阅读理解评价系统以及电子化答疑系统等。这对于学习分析领域的研究,辅助教师进行答疑、阅卷、学习行为干预,帮助学生进行成绩预测和更高效的学习有着
虚拟学习社区角色分类旨在探究虚拟学习社区交互网络中不同类别的学习者在协作式知识构建网络中的行为特征和其所处位置对知识构建过程的推进作用。目前,以MOOC为主的异步式虚拟学习社区中,多数课程存在学习者众多,但学习者参与讨论式知识构建活动的活跃度不高的情况。现有的虚拟学习社区角色划分方法主要有:机器学习方法、内容分析方法、数学分析方法和以凝聚子群、中心性方法为主的社会网络分析方法。上述方法主要存在以下
当今时代信息爆炸式增长,用户如何从海量的数据里快速地查找到自己所需的信息显得至关重要。它不仅带来很多值得研究的学术问题,还催生了像百度、谷歌等以搜索引擎为主营业务的科技巨头,而搜索引擎的核心技术之一就是信息检索。文本信息检索研究的是如何从大规模文档集合中找出满足用户需求的文档的过程。其中的关键技术包括:计算查询与文档的匹配、按匹配程度给文档评分并排序。好的信息检索模型能把与查询主题相关的文档排在返
微生物之间存在多种交互关系,如共生、竞争、寄生等各种类型的交互。研究微生物之间的交互关系是理解微生物群落的结构和功能的前提和基础。大量关于微生物交互关系的研究成果发表在生物医学文献中,从这些无结构化的文本中抽取出相应的微生物交互信息,并组织成结构化的知识库,是一种有效的研究微生物交互关系的方法。现有文本挖掘的工作简单地将微生物之间的关系定义为有或无两种,而忽略了微生物之间丰富、细致的关系类型。因此
图像的分辨率意味着图像中包含的信息量,图像超分辨率重建技术通过算法将输入的低分辨率图像重建得到对应的清晰的、纹理细节更加丰富的高分辨率图像,在医学、遥感、公共安全、计算机视觉等各个领域普遍应用。因此,图像超分辨率重建算法近年来被广泛研究。目前基于卷积神经网络的超分辨率重建任务在重建性能和重建效率方面都远超于传统算法,但依然存在在真实模糊图像上重建效果较差的问题。针对这个问题,本文重点研究了基于真实
近年来随着电动汽车的快速发展,电网、信息网、交通网呈现相互交叉、相互支撑、相辅相成的发展态势。电网、信息网和交通网逐渐演化为一个复杂的耦合系统。电动汽车不确定性的充电行为会进一步加大电网负荷峰谷差增加电网负担,聚集性充电会增加交通网的道路拥堵程度。电网-信息网-交通网融合可实现智慧交通,从而解决电动汽车快速增长给电网以及交通网带来的问题。但目前却缺少对电网-信息网-交通网耦合系统的仿真研究,因此对
随着互联网技术的快速发展,人们通过社交平台的联系也越来越紧密。因为社交平台具有虚拟性和即时性,使得各种复杂纷乱的信息在互联网上肆意传播。短文本是社交平台中不良信息的主要传播形式,如何准确有效地过滤这些流传在社交平台的不良文本,是一个非常有社会意义的研究工作。自然语言处理技术为网络不良文本过滤问题提供了可行的方案,但社交平台上传播的文本表达往往不符合语言规则,也存在着大量词语变体、情感语言糅合等特点
面部表情识别是机器理解人类情感、情绪的途径之一,在人机交互、学习分析等领域有着广阔的应用前景。受制于面部表情图像固有的类内差异,面部表情识别技术尽管在近几年取得了可喜的进展,但现有算法的精度与实际应用要求仍有较大差距。导致面部表情图像类内差异的原因至少包括:(1)主体身份特征和面部表情特征交织。从面部图像上提取的特征中势必包含大量的主体身份信息,造成同种表情不同主体的图像在特征空间距离较大。(2)