基于粒子群优化的极限学习机的XML文档分类中的研究与应用

来源 :东北大学 | 被引量 : 4次 | 上传用户:littlerabit75
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种典型的半结构化文档,XML同时拥有内容和结构信息。如何构建表达模型,有效的表达XML文档的内容和结构信息,是对XML文档分类之前需要考虑的首要问题。本文在传统结构链接向量模型SLVM的基础上提出了一种改进的XML文档表达模型I-SLVM。I-SLVM通过文档覆盖率标准选择分类能力强的特征词,通过改进的TFIDF公式计算特征词的特征值,并且将XML文档中的节点权重信息加入文档特征向量,有效表达了XML文档的内容和结构信息,同时避免了文档特征向量高维的问题。针对极限学习机ELM随机选择隐藏层节点参数可能导致需要较多隐藏节点等问题,本文提出了CPSO-ELM算法。在CPSO-ELM算法中,本文基于混沌优化搜索策略,设计了一种改进的算法CPSO,用来选择单隐藏层前馈神经网络中隐藏节点的输入权重和偏置,而隐藏层和输出层之间的权重通过广义逆矩阵分析得出。其次,本文提出的CPSO-ELM算法通过验证集上的分类准确率和隐藏节点输出权重的范数共同来选择SLNF中隐藏节点的输入权重和偏置。实验结果表明,与传统ELM、E-ELM相比,CPSO-ELM算法拥有更好的分类性能。同时,相对于传统ELM,CPSO-ELM算法拥有更加简洁的网络结构。
其他文献
近些年来社交网络得到了快速的发展,其独有的特性使得用户发布消息更加容易,信息传播更加快捷,然而社交网络的发展也对于商业机构的管理者和政府机构的决策者,提出了一定的挑
本文讨论了软件复用(Software Rouse)中的几个常见问题:软件构架(Software Framework)的使用、脚本语言(Script Language)以及面向对象(00--Object Oriented)方法与软件复用的关系。利
该论文针对GIS的发展趋势,在对当前InternetGIS技术深入分析的基础上,提出了基于平衡网络负载的InternetGIS实现方案.论文分为五个部分:第一章简要概述了地理信息系统的历史
软件能力成熟度模型(CMM)是一种对软件企业开发能力的评估模型,可以通过指导开发组织如何进行过程改进,从而帮助软件企业达到更高级别,并向成熟的软件工程体系演化,并形成一
近年来,信息技术有了迅速的发展,如何及时准确地传递数字图象是其中一个重要的课题。在利用人造卫星和飞机遥感获取、传输等过程中,会造成图象的退化,使之与真实图象有一定差异。
随着IPv4地址的日益减少,使用IPv6地址替代IPv4地址已成为解决地址匮乏问题的关键,这就使IPv4向IPv6过渡成为越来越重要的课题。由中国电信提出的Lightweight address family
网络技术发展速度迅猛,越来越多的Web Services和语义Web Services遍布于网络上,人们对于服务的选择范围越来越广,对于服务的利用也越来越方便。网络上有众多服务可供选择,而
该文首先分析并研究了现有的构件模型以及构件集成方式.通过对三种不同接口形式体系结构的分析,基于有关构件模型和构件描述语言,设计实现了基于是一模型的组装工具.该文第1
本文分析了四川省卫生厅建立四川省医疗卫生信息数据仓库及联机统计分析的必要性和迫切性,阐述了数据仓库技术的来源、提出了四川省医疗卫生信息数据仓库及联机统计分析系统的
该论文主要探讨了若干关于数据仓库设计和数据挖掘实现的问题.首先,在总结前人提出了的数据仓库平台的基础上,针对其不足提出了自己的改进方法.数据仓库平台是决定数据仓库环