一种新的基于向量空间模型和神经网络的文献分类系统

来源 :四川大学 | 被引量 : 0次 | 上传用户:chen126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文旨在建议一种新的基于向量空间模型和神经网络的文献分类系统(简称“文献分类系统”),用以从文本信息数据中挖掘出有用的信息.该文建议的文献分类方法,在系统构成、文献标引和文献分类均与现有文献分类系统有所不同,表现在以下几个方面.在系统构成方面,该文在系统中设置一“词相似矩阵”作为“中间件”(如图4-5所示)以表示词与词之间的关系,同时也增强系统的适应能力.在文献标引方面,该文标引方法与现有文献标引方法主要有两点不同.其一:现有文献标引方法均以特征词向量为基础构成文献向量,且将特征词向量视为一组正交相量,即将词与词之间视为独立的,彼此之间没有关系.这一假定与事实不符.该文摒弃了该假定,认为词与词之间具有一定的关系,并由它们之间的关系构成文献概念向量,在文献概念向量的基础上再构成文献向量.其二:现有文献标引方法由特征词向量直接构成文献向量,文献向量的维数与特征词个数相同,从而文献向量的维数巨大.该文由文献概念向量构成文献向量,由于文献概念向量的维数小于特征词个数,故文献向量的维数小于特征词个数.并在此较小维数文献向量的基础上,利用信息熵再次对文献向量进行降维.所以,该文之文献向量是经过两次降维后得到的,它的维数远远小于现有文献标引方法所得文献向量的维数.
其他文献
该文适应医院未来发展的需要,结合病人的就诊流程和医生的工作习惯,以病人就诊过程中产生的信息为中心,面向医生工作站,建立了多媒体电子病历系统.该文在以下两个方面作了自
该文以网络税务系统NTS为应用前景,根据电子商务原理,在研究软件体系结构理论、中间件技术、Internet数据传输技术和加密技术的基础上,结合税务信息化要求,为税务系统提出了
该文在模糊控制的基础上,结合了滑模控制,自适应控制等控制方法和理论,针对一类非线性不确定系统,提出了一套模糊滑模控制方法.其主要工作如下:1.该文针对一类非线性不确定单
该文研究了风险投资及其项目评价的理论进展,比较分析了国内外风险投资的发展及现状.将风险投资项目评价分成项目筛选和责任审查两个阶段,每个阶段均建立了评价指标体系并给出
该文简述了变频调整的发展、研究现状,及当今国际流行的异步机速度辩识方法.根据异步电动机转差频率矢量控制原理,推导出了矢量控制异步电动机解耦数学模型;根据观测异步电机
该文结合虚拟现实技术,主要是虚拟现实建模语言、计算机图形学、计算机辅助几何设计以及面向对象技术,对基于WWW的虚拟场景的创建、交互和控制进行了极有意义的探索研究,并为
计算机集成制造系统(Computer Integrated Manufacturing System)是一种高层次的制造系统.FMS作为CIMS的一部分,其车间生产计划调度与控制问题是提高生产资源(特别是主要设备
该论文针对状态反馈预测控制的约束处理问题,采用了不同方法加以解决.首先,应用满意控制思想,提出了自启发式的处理约束的单值算法.通过离线设计保证算法的可行性,并且可以实
该文介绍了作者在该课题里面所做的工作:包括在SoccerServer的有限通讯和环境因素复杂的情况下,怎样增强智能体对环境信息的感知能力,设计了一种灵活的队伍模型结构,使球队在
该论文对关联规则的挖掘算法和实现技术进行了研究.数据挖掘就是从大规模的数据库中发现以前不知道的各种知识和信息,人们利用这些知识和信息可以从事更加有效的经营管理和决