【摘 要】
:
随着科技的进步,时间序列成为应用最广泛和最常见的数据类型之一,例如在金融、医学和气象学等领域,都会产生大量的时间序列数据。对时间序列数据的研究与分析已经受到了越来
论文部分内容阅读
随着科技的进步,时间序列成为应用最广泛和最常见的数据类型之一,例如在金融、医学和气象学等领域,都会产生大量的时间序列数据。对时间序列数据的研究与分析已经受到了越来越多的关注,然而由于时间序列数据具有连续性的特点,其数据量通常十分庞大,给数据存储和传输造成了很大的困难。因此在越来越庞大的时间序列上进行有效的压缩处理成为了一个急需解决的问题。对于时间序列近似压缩问题,分段线性函数逼近的方法是应用最广泛的解决方法之一。这些方法对时间序列能够取得较好的压缩效果,但是没有充分挖掘和利用时间序列的内在联系和特征。例如对于存在较多相似片段的时间序列的压缩,可以充分利用其存在基序的特征来获得理想的压缩比率,使得压缩效果最大化。本文提出了一种新型的面向时间序列的阈值近似压缩方法,其基本思想是利用时间序列中相似的子序列来对整个时间序列进行压缩。对于时间序列子序列的相似性计算问题,本文提出了一种时间序列二叉树结构转换的思想,将时间序列转换成二叉树结构,通过二叉树结构的比较可以直接排除不相似的子序列,提高了时间序列相似性计算的效率。本文通过滑动窗口机制在时间序列中搜索相似的时间序列子序列,对于滑动窗口带来的频繁建二叉树的问题,提出了一种动态增量树,可以动态的调整建二叉树,有效的减少了算法的时间开销。本文不但在理论上证明该压缩方法的正确性,保证了压缩后的时间序列的误差是在阈值范围之内,而且通过实验验证了这种压缩方法可以在较高的精确度的条件下得到理想的压缩水平。
其他文献
志愿计算作为近年来分布式计算领域中的一个新兴计算模式,在医学、天文学、物理等科学研究领域得到应用。因志愿计算具有开放、匿名、高自由的特性,参与计算的志愿者可能出现
经过十余年的发展,对等网络(Peer-to-Peer,简称P2P)经历了从中心索引服务器结构、非结构化覆盖网络,到结构化覆盖网络也就是分布式哈希表(Distributed HashTables,简称DHT)的
随着计算机的普及应用,计算机程序的正确性证明变得越来越重要。演绎验证是一种重要的程序正确性证明方法。它用逻辑公式描述程序性质,用一组公理和规则进行推导,从而能够证明程
随着改革开放30年来我国经济的高速发展,科学有效的工业生产已变得越来越重要。车间调度问题作为工业生产的代表,对其的有效求解也就意义重大。作为一个NP-hard难的多目标优
网构软件是Internet环境下一种新的软件形态,其与传统软件的主要区别在于开放性及变化性,准确定位需要进行优化的系统成分是网构软件自我优化的必备能力。模式是人们所熟知的一
随着电池供电的计算设备的广泛使用,延长电池使用时间的需求越来越明显。同时,随着集群系统耗电成本的增加,降低系统能耗的需求也非常迫切。为了解决这两个问题,出现了很多致
采用人工经验的方法进行电路设计已不能满足较大规模的电路设计要求,而演化算法与可编程逻辑器件相结合产生的演化硬件技术,又为较大规模电路设计开辟了新途径。采用演化算法
随着物流业在商业中的地位越来越重要,对物流方向上的研究也越来越多。无线射频技术(RFID)在物流领域的广泛应用,也促进了它的发展。
物流网中,物流中转站是整个网络中
计划评审技术(PERT,Program Evaluation and Review Technique),是50年代后期发展起来的现代项目管理的重要技术模型之一,它是以网络图为基础的计划模型,即用网络图来表示项
国内外学者已经提出很多聚类方法,这些方法各有优缺点,如K-均值算法简单易行、收敛快速,但是它需要事先给出聚类数目K,这在实际问题中是很难做到的;此外,该算法随机选取初始聚