时序模式发现算法研究与改进

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:lgs0519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。被信息产业界认为是数据库系统最重要的前沿之一,是信息产业最有前途的交叉学科。 数据挖掘算法的好坏将直接影响到所发现知识的好坏。目前大多数的研究都集中在数据挖掘算法和应用上。本文根据数据挖掘领域的需求和现状,研究了复杂数据库中的时序数据库挖掘技术。主要从事的是,在时序数据中发现时序模式。 本文概述了时序模式发现所涉及的领域和学科的基本理论知识、目前的研究现状,并分析了它的研究意义。同时给出了本文的具体的工作,主要是:对在时序数据序列中发现模式问题进行了描述,并介绍了一种新的趋势逻辑表示方法,给出了其算法及算法的实验结果;对时序数据进行处理,提出了利用线段的斜率反正切值作为模式识别的样本,从而在分类时忽略模式的畸变;另外,还提出了一个新的基于高阶神经网络的时序模式发现算法。在这一算法中,作者运用了单层的高阶神经网络和分层方法。单层高阶神经网络没有隐含层节点的困扰,训练速度更快;模式分类能力更为强大;不存在局部最小的问题,模式分类精度更高;模式的不变性构建于网络结构之中等优点。分层方法能加快各节点神经网络的学习速度,也能提高模式划分精度。这两种技术使得算法的分类效果更好。给出了算法思想,并实现了此算法。 实验结果表明,作者提出的算法在分类的精度上有了一定的改善。 本文提出的算法,可以应用到具有时序数据的领域。同其他的时序模式发现算法相比较,具有几点创新:1)从分类精度的角度来改善时序模式发现算法;2)通过高阶神经网络,直接利用网络的特性忽略了时序模式的某些畸变;3)利用了分层方法,进一步改善分类精度。
其他文献
该文阐述了数据仓库的基本概念和方法,探讨了数据仓库作为决策支持系统的一种有效和可行的体系化解决方案包括的三个方面的技术内容:数据仓库技术.联机分析处理技术(OLAP)和
UML是一种工业界应用最为广泛的建模语言.自1997年OMG提出UML概念至今,UML得到迅速的扩充和发展,目前已经成为面向对象系统的规范语言标准.但是由于缺乏形式化的语义及其多视
单元测试是软件测试流程的第一步,充分有效的单元测试可以尽可能多的发现软件故障,降低开发成本,提高软件质量。代码测试系统(Code Testing System,CTS)是一款由Java语言实现
Email是Internet上进行通讯最常用的方式,而邮件用户代理(MUA)是用户用来发送或接收Email的客户端程序。目前广泛使用的MUA是针对具体平台开发的,例如Microsoft公司的Outlook E
该论文根据Jones提出的文档方法论,采用包括J2EE和LDAP在内的先进的软件技术,设计了基于J2EE的文档管理系统的体系结构和软件层次模型.这是一个配置灵活的、可伸缩的以及具有
该文针对当前分布式安全现状和现实需要,分析和跟踪了国外分布式安全和应用服务器的最新进展,并就基于J2EE的分布式安全体系结构进行了比较深入的研究.在分布式环境下提供的
该论文主要包括五个方面内容.第一部分,定义告警信息语法模型;第二部分,如何从含有很多噪音的告警数据中,发现告警相关性规则的数据挖掘算法的研究;第三部分,如何进行增量数据挖
随着互联网的快速发展,云计算概念持续升温。云计算所具有的高可靠性,可扩展性,按需计费,虚拟化等特性使其在产业界、学术界、政府等各界引起强烈的关注。在互联网的冲击下,
随着移动计算机日益广泛的使用和人们对网络依赖性的增加,如何让人们能够随时随地的访问Internet,在移动的过程中保持通信不间断已经成为当前Internet技术研究的关键问题.传
随着计算机技术和电信技术不断发展和进步,加上日益旺盛的社会需求的持续推动,呼叫中心行业一直处于高速发展。但是多年以来呼叫中心的建设模式还是以自建为主,其高昂的建设