论文部分内容阅读
随着传感器网络、互联网、通信等技术的蓬勃发展,数据流的应用越来越广泛和深入。重症监护病房(Intensive Care Unit,ICU)是数据流的一个典型应用环境,在工CU中医护人员需要利用多种设备对病人生命体征进行7×24小时不间断的实时监控。他们对病人处于某种特殊状态(例如危险状态或报警状态)下的数据往往要进行具体分析,并且需要在医疗数据流上的大量聚集查询来完成对病人病况的统计。为此,本文提出并实现了一种基于状态窗口的查询机制,并设计了一种有效的多聚集查询优化策略,主要内容包括:
提出了一种基于状态的窗口模型,以数据值为依据来确定窗口的起始和终止,并提出了在状态窗口上内嵌滑动窗口的思想。解释了状态窗口模型的语义,在现有查询语言的基础上进行扩展,以满足该模型下查询表达的要求;
设计并实现了一种灵活的聚集查询框架,支持在状态窗口上聚集查询的执行;
针对现有多聚集查询优化算法鲜有考虑查询执行过程中优化的情况,设计了一种多聚集查询优化策略,利用对各个查询建立的索引来标识系统可以进行优化的时机。
海量真实数据集上的实验证明,本文提出的查询框架可以在医疗数据流上有效运行,多聚集查询优化策略也比现有算法在时间和空间开销上都有较大的改讲。