论文部分内容阅读
日前,传感器网络(Sensor Networks)技术已经被广泛应用于很多领域如空气质量监测、水体污染监测等。在这样的监测应用中,相比于原始感知数据,用户对所监测区域内数据的实时分布以及其中隐藏的典型分布模式和变化趋势等也很感兴趣。若能给用户持续提供网内数据的实时分布,并给出基于实时分布分析所得到隐藏的典型模式以及变化趋势等,用户便能够深入了解所监测区域的数据分布及其变化特点,为各种决策提供科学依据。
传感器网络中资源异常有限,尤其是节点能量限制。因此研究如何能量高效的对大规模传感器网络的数据实时分布进行分析具有重要的意义。而传感器数据随时间动态变化,网内能量高效地、持续地发现实时数据分布并对其进行分析面临着很大的挑战。已有的传感器网络数据的研究方法往往更关注如何能量高效获取原始数据而较少考虑对其中隐含的分布和趋势的分析。
本文就如何能量高效获取实时分布并基于实时分布进行概要分析展开深入研究来解决上文提到的问题。主要的研究内容和创新包括:
1、本文研究了如何能量高效地获取实时分布模式,提出了网内持续聚类算法,以发现传感器数据的实时分布。
网内持续聚类算法采用模型刻画数据沿时间的变化趋势,通过基于模型的相似性对节点进行持续聚类,保证当传感器节点数据随时间动态变化时,每个时刻的实时聚类结果都尽量贴近当前数据的真实分布。在整个聚类过程中,模型也会随数据的动态变化进行调整。该方法克服了已有传感器网络中聚类方法面对传感器数据动态变化的不适应性。
2、本文针对持续聚类所得到的每个周期的实时分布进行巧妙的处理,从概要分析的角度,提取出同期代表模式和演变模式,为用户揭示数据分布中所隐藏的模式和趋势。
同期代表模式分析是要从某属性在某个时间段内的多个同期的分布中找出代表性的分布来代表一般分布模式。演变模式所刻画的是某个属性在某个时间段内,分布状况随时间的变化情况。同期代表模式和演化模式的发现使人们能够更加深人了解传感器网络中数据的分布模式及其变化趋势,为日常生活中的各类决策提供科学依据。
本文在实验平台之上实现了实时分布获取与分析系统,在真实数据集上实验分析表明了持续聚类算法的有效性和高效性以及代表模式分析和演变模式分析的算法的有效性和适用性。