时间序列数据挖掘中的若干问题研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:zhang3862066
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是数据挖掘中一种重要的数据类型,在现实世界许多领域中广泛存在,如股票价格,商品销售数据,气象数据等。且随着时间推移,这类数据的存储规模呈现爆炸式地增长。如何对这些海量时序数据进行有效的知识发现,挖掘其内在的各种变化模式,是一个挑战性的、具有重要理论意义和实用价值的课题。本文在分析时间序列数据特点和实际应用需求的基础上,针对时间序列的数据挖掘中的一些关键问题进行了研究,具体包括特征模式挖掘、相似性模式查找、多维时间相似性查找等方面,主要的工作集中于以下三个方面:针对时间序列的特征模式问题,采用无须生成大量候选模式集的互关联后继树挖掘算法。该方法基于重要点的序列分段化算法和相对斜率的局部符号化方法,既减少了计算复杂度,又避免了噪声的影响。在算法实现上,根据序列特征模式的有序性和重复性,极大地提高了挖掘效率。实验表明,这种方法的挖掘结果是一种图形化的描述,具有明确的实际含义,便于在实际中应用。针对时间序列相似性查找问题,采用海量全文索引技术——互关联后继树索引模型对时间序列进行挖掘。该方法基于重要点分段技术,利用分段动态弯曲距离作为相似性度量,即保证了度量的鲁棒性,又减少了计算复杂度。研究证明文中的方法不仅提高了结果的准确性,也体现了传统方法所没有的优势。不仅保证查找的结果不会出现任何正确结果的丢失和错误结果的引入,而且也显示出比传统方法具有明显的优势。针对多维时间序列相似性查找问题,采用了一种可应用于多维时间序列的快速相似搜索方法。该方法将序列(子序列)的局部变化特性与检索结构(k-d树)结合起来,使得在搜索k-d树的同时实现了序列(子序列)的局部变化匹配,这种方法既能体现序列(子序列)间的整体距离关系,又能体现它们自身的局部变化,从而极大地提高了查询效率和正确率。实验证明了文中算法的有效性和可行性。
其他文献
QoS组播路由问题是一个非线性的组合优化问题,已证明该问题是NP完全问题,传统方法很难求得全局最优解。解决此类问题一般采用启发式算法,启发式算法包括蚁群算法、粒子群算法等
随着社会的发展,以人为本的思想已经渗透到社会的各个领域。以用户为中心的研究UCD(user-centered design)在国内外计算机行业方面已经作为重点研究,与传统方法不同,以用户为
虚拟制造和虚拟现实的结合与应用从根本上改变了现行的制造模式,对相关行业也产生了巨大影响。移动电话产品设计是一个非常繁复的过程,要经历许多不同的设计方向,因此迫切需要对
数据挖掘是随着信息技术不断发展而形成的一门新学科。它帮助人们在信息海洋中发现有用的知识和信息,面对信息时代海量数据的出现,如何有效地利用巨量的原始数据分析现状以预测
作为商业银行吸引客户和开展各项业务的重要设施,ATM选址是否得当直接关系到商业银行的利益。科学的选址决策有利于提高银行工作效率,增加效益,方便储户:选址不当则可能造成银行
学位
MIMO(多输入多输出)和OFDM(正交频分复用)技术作为B3G移动通信和宽带无线局域网的两个关键技术,越来越受到人们的重视。MIMO系统在发送端和接收端利用多个天线同时在相同的频
随着日益增长的交通需求,交通问题已成为全世界所共同关注的主要问题。如何运用计算机科学等现代的科技手段来缓解日益严峻的交通压力,已成为目前研究的重点。建立ITS(智能交
交通客流量预测作为智能交通系统的一个重要研究方向,能够有效的为城市道路建设,智能交通疏导等领域提供行之有效保障措施。通过对大量过往交通客流量数据的分析,同时结合神
随着科技的迅速发展,人们对数字信号处理的要求也越来越高,传统的奈奎斯特采样定理在很大程度上限制了信息的处理能力。而压缩感知理论打破了传统的采样限制,实现了采样方式
近年来,数字图像已经成为人们获取信息的主要手段,如何保护图像信息的安全已经成为各界广为关注的问题。由于混沌系统产生的混沌信号具有类似噪声、结构复杂、难以分析以及对