分布式数据流kNN查询技术研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:fire1977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的飞速发展,一种新型的以流形式存在于分布式网络中的数据模型——数据流,引起人们越来越多的关注。近些年来,数据流已广泛应用于传感器网络、金融数据分析、网络数据监控、气象预测等应用领域中,传统的数据库管理系统已无法满足其实时性、连续性、数据无界性等特性的需求,因此新的分布式数据流管理系统已成为专家学者研究的热点之一。   数据流的kNN(k-Nearest Neighbors)查询是分布式数据流处理系统(DSPS)中最常见的应用之一,也是传统数据库系统中研究最多的问题之一。现今DSPS中的kNN查询算法均基于二级网络模型,但该网络模型下kNN查询存在很多缺陷,例如所有数据同时向查询处理服务器发送,导致中心服务器占用大量网络资源,可能造成网络堵塞,查询站点自身负载极大;通信成本高等。   本文首先分析讨论了目前国内外DSPS中kNN查询的研究现状,总结了现有方法的优缺点,针对当前基于二级网络模型中网络流量大、中心结点负载重等问题,提出一种新的网络模型,将二级网络模型扩展到更通用的层次网络模型,充分利用网络资源,在远程节点与查询节点间布置多个中间节点,以处理数据,降低网络数据传输量。   在上述理论的基础上,论文最后模拟了分布式数据流的查询系统,通过数值实验证明新网络模型的优越性。
其他文献
面向对象分析与设计系统在当今软件企业中有着非常广泛的应用,它有目的地把系统分解为模块策略,并将设计决策与客观世界的认识相匹配,为复杂度越来越高、规模越来越大的软件系统
随着计算机应用的日益普及和深入,软件系统的规模和复杂性不断增大,研制可信软件技术以提高软件系统的质量已经成为十分重要和迫切的需求。   软件开发生命周期可以分为需求
支持向量机(Support Vector Machine,SVM)是近年来受到广泛关注的一类学习机器,它以统计学习理论(Statistical Learning Theory,SLT)为基础,具有简洁的数学形式、标准快捷的
随着网络带宽越来越大,网络应用越来越复杂,网络安全问题也日益严重。在骨干网进行安全内容检测,作为国家信息安全的重要一环变得越来越重要。骨干网的主要功能需求是及时高效的
学位
P2P是Peer-to-Peer的缩写,简单地来说,P2P就是计算机系统之间通过直接交换的方式共享资源和服务。这些资源和服务可以包括交换信息、处理器计算资源、磁盘文件存储等。在P2P的
Deep Web是指网络上众多可以在线访问的数据库,其中的数据对传统搜索引擎大部分是不可见的,它们可以通过网站提供的查询接口访问,数据量巨大。但HTML的无结构化、异质性、动
学位
在知识社会的今天,知识的建构性、社会性、情境性、复杂性和默会性得到重视,为学习提供了新的见解、方法和手段。整个社会的学习活动在资源、群体、观念、内容和环境上正在发生
学位
随着用户对审批系统动态性以及适应性要求的提高,传统的审批系统在需求变化时,调整需要付出高昂的代价,很难适应当前审批的需求。当前审批流程越来越复杂并且流程具有不确定
地理信息系统发展到现在,提出了位置智能的概念。它是从传统的GIS应用发展衍生而来的,不过其已经不仅仅局限在GIS应用上。   文章首先介绍了与位置智能相关的技术和理论,对其
随着信息技术和数据库技术的迅猛发展,人们可以非常方便地获取和存储大量的数据。如何从大量的数据中快速提取有用的和感兴趣的信息,成为海量信息处理面临的瓶颈。聚类分析技