【摘 要】
:
时间序列数据压缩是其数据挖掘研究的基础和重要问题,好的时序数据压缩方法应可以极大地降低数据维度、尽可能保留局部和全局特征、算法复杂度尽可能低、降维后的数据重构质量高等。时序数据压缩是近年来的研究热点。本论文以“质量保证的数据流压缩算法及不解压查询算法”课题为背景,主要研究时序数据的压缩方法,重点研究了基于L_∞准则的最优压缩算法。在分析基于L_∞准则的半连续最优分段线性压缩算法基础上,提出了基于最
论文部分内容阅读
时间序列数据压缩是其数据挖掘研究的基础和重要问题,好的时序数据压缩方法应可以极大地降低数据维度、尽可能保留局部和全局特征、算法复杂度尽可能低、降维后的数据重构质量高等。时序数据压缩是近年来的研究热点。本论文以“质量保证的数据流压缩算法及不解压查询算法”课题为背景,主要研究时序数据的压缩方法,重点研究了基于L_∞准则的最优压缩算法。在分析基于L_∞准则的半连续最优分段线性压缩算法基础上,提出了基于最大误差的生成最优混合段的在线PLA算法,并进行算法分析和实验验证。主要研究内容包括:(1)基于L_∞准则的半连续最优分段线性压缩算法:为了在处理时间序列过程中获得质量保证的分析结果,在最优不连续分段近似算法(DisConnAlg)基础上,产生了一种半连续的最优分段近似算法(SemiOptConnAlg),用于在最大误差界限下生成最少数量的半连接直线。此方法提出“半连续”概念,此半连续方式与传统的连续方式区别在于,连接点不一定位于整时刻点,有可能是两个时刻点之间的任意位置。在实现两个不连续线段的半连接时,提出了两个策略“缩减策略”和“扩展策略”。(2)基于最大误差的生成最优混合段的在线PLA算法:为了节省数据存储,减少数据传输,加速数据查询和分析时间,提出了一种新的最优线性时间PLA算法(SemiMixedAlg),该算法用于生成一组混合段(连续段和断开段),保证最大误差和最小化存储。高效的“Trying-length”策略被设计,旨在确定断开段的位置,以最小化混合段的存储。(3)SemiOptConnAlg和SemiMixedAlg两种算法实验:采用UCR时间序列存档的43个数据集,将误差范围设置为值范围的2.5%,5%和10%,在Eclipse中用C++编码,将SemiOptConnAlg与连续和不连续算法在生成段数、存储和运行时间上做了对比实验,并进行了结果分析;SemiMixedAlg与PipeMixedAlg算法在时间成本和内存成本上进行对比试验,并与SemiConnAlg进行结果分析。
其他文献
简要介绍了大型沥青拌和站快速搬迁的方法,并对大型设备的搬迁工作提出了一些建议.
将学习型组织的基本理论应用于高校建立学习型党组织有重要意义,既是永葆党员队伍先进性、促进和谐校园建设的需要,也是遵循高校党组织建设自身规律的举措。建立共同愿景,营
我国博士点审批政策的基本走向是:从重视学科到重视单位整体,从注重条件到强调需求,从高校与科研院所一视同仁到以高校为主,从公平竞争到强化分层办学。我国博士点审批政策应注重
随着无人驾驶技术、无人机技术及智能交通技术的发展,运动平台的防撞技术得到了学术界和工业界的广泛关注。典型的防撞技术包括微波雷达、激光雷达、光学视觉以及超声雷达等。毫米波防撞雷达凭借着高精度、小型化、低功耗以及全天时全天候适应性等优点,成为了最有前途的防撞手段之一。毫米波防撞雷达主要由收发天线、射频前端电路和后端信号处理模块三部分组成。由于天线位于系统的最前端,负责电磁信号的发射和回波信号的接收,其
英国是知识产权保护的制度与思想起源的重要国家之一。英国最早的知识产权保护诞生于中世纪晚期。约14世纪初,英国国王为促进王国的经济与技术的发展,赋予一些掌握特定技艺者对该技术或在相关行业的垄断性权利,逐渐形成一种“专利特许证”的传统,这是英国知识产权保护在实践上的发端。1624年,《垄断法》的颁布则成为英国知识产权保护制度性的开端,以明确的法律表明事关且有利于公共利益的发明专利能够得到一定期限内的合
晶体硅材料是半导体行业和太阳能行业的基石,根据用途的不同分为光伏级和电子级,后者对制备工艺有着更苛刻的要求。改良西门子法是当前多晶硅材料制备的主流工艺,在还原工段,原料气体在高温的硅芯表面发生化学气相沉积反应(CVD),实现晶体硅的沉积生长。尽管我国多晶硅材料总产能已居世界第一,但电子级多晶硅每年进口仍以十万吨计。为了满足电子级多晶硅产品对沉积质量的要求,国内企业通常会降低沉积速率,但这会导致原料
随着国内大规模水电开发,对生态环境影响的评价与生态修复至关重要。国内外针对不同水电工程的生态环境影响在评价方法、指标体系等方面开展了一系列有益的研究和实践。由于工程生态环境影响涉及的生态影响指标复杂多样,生态影响评价难以定量化等诸多问题,对生态影响评价方法和模型的研究一直是环境影响评价中的难点和热点问题。本文运用模糊数学基本原理,综合采用文献分析法、模糊层次评价法,对水电工程生态环境评价的方法进行