基于分段直方图的时间序列相似度查询

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:qinyongj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种使用直方图描述时间序列数据、查询时间序列相似度的新方法,与已有的工作相比,本文的方法具有以下优势:1.时间序列分段直方图不仅可以处理全序列匹配.还可以处理子序列匹配的;2.加权欧几里得距离考虑了不同直方桶之间的相似度,从而减少了值空间划分带来的边缘效应;3.分段直方图方法对时域、幅度上的平移和缩放具有不变性,而且可以过滤由噪声和采样率不同带来的差异。实验表明,该方法能够准确、全面地处理时间序列数据的相似度检索。
其他文献
数据仓库要求对海数据量的复杂查询进行快速响应,利用实体化视图是一种很重要的方法。本文从数据仓库系统的特点出发,结合OLAP查询的特殊性,提出了DSMV算法。主要创新点在于: 1)
会议
随着企业业务的发展与信息的膨胀,数据仓库的规模不断扩张,数据访问呈现更广的地域分布性,提高数据仓库在Web环境下的数据访问性能是本文所讨论的内容。通过DW-DS结构来构建Web
本文提出的算法是通过在数据仓库的所有物化视图间找出相同的基表连接,并把这些连接定义成辅助视图,使用额外的存储空间存储这些辅助视图,因此这些连接只要建立一次.就可以在多
本文根据电力营销决策支持的特点,对电力营销决策支持系统中的查询方法进行了研究,实现了一组预定的分析方法,能够适应电力决策的需求,可以在年和月的级别上进行同期的比较,在地区
本文主要讨论在并行数据仓库系统ParaWare中OLAP操作的缓存技术.并行数据仓库系统ParaWare是由中国人民大学信息学院研制开发的、基于混合并行体系结构的高性能、大规模OLAP
本文以最优二叉树理论为基础,根据特征项加权形成辅助样本,并借助辅助样本和著名的Euclidean距离,提出自动聚类算法,克服了传统聚类形状单一,难以合并和分解等问题,从而提高了聚类
会议
本文以传统的数据迁移为基础,设计了一套适应数据库网格的特殊环境数据迁移协议,在迁移会话的过程中加人了资源预分配和迁移参数设定的过程,并且针对迁移会话的不同阶段,定义了一
Mediator体系结构由Wiederhold在1992年首先提出、它适用于规模很大但对查询效率要求不高且源数据经常更新的系统。与传统的数据仓库的一个主要不同是,用户是以一个虚拟的中介
会议
本文首先给出一个异构数据集成系统HDIS,HDIS是一个实验性的原型系统,它基于Mediator/Wrapper体系结构,对数据源过滤、通用Wrapper的设计、查询优化和语义冲突消解等问题都给出
会议
分布式数据挖掘由于在应用上较集中式数据挖掘具有更多的特殊性,如分布的数据源、节点间的通讯等等,都会影响到挖掘的效率.在分类问题的分布式数据挖掘中,不同节点上的分类器
会议