基于扩展角分类神经网络的文档分类方法(英文)

来源 :软件学报 | 被引量 : 0次 | 上传用户:jnbosine
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
CC4神经网络是一种三层前馈网络的新型角分类(corner classification)训练算法,原用于元搜索引擎Anvish的文档分类.当各文档之间的规模接近时,CC4神经网络有较好的分类效果.然而当文档之间规模差别较大时,其分类性能较差.针对这一问题,本文意图扩展原始CC4神经网络,达到对文档有效分类的效果.为此,提出了一种基于MDS-NN的数据索引方法,将每一文档映射至k维空间数据点,并尽可能多地保持原始文档之间的距离信息.其次,通过将索引信息变换为CC4神经网络接受的0,1序列,实现对CC4神经网络的扩展,使其能够接受索引信息作为输入.实验结果表明对相互之间规模差别较大的文档,扩展CC4神经网络的性能优于原始CC4神经网络的性能.同时,扩展CC4神经网络的分类精度与文档索引方法有密切关系. The CC4 neural network is a new type of corner classification training algorithm for the three-layer feedforward network, which was originally used for the document classification of meta search engine Anvish.When the scale of each document is close, the CC4 neural network has good However, the classification performance is poor when there are large differences in the sizes of documents.To solve this problem, this paper intends to extend the original CC4 neural network to achieve the effective classification of documents.Therefore, a new MDS -NN data indexing method, each document is mapped to k-dimensional space data points, and as much as possible to maintain the distance between the original document information.Secondly, by transforming the index information into CC1N0 networks accepted by the 0,1 sequence , Which can expand the CC4 neural network and make it accept the index information as input.The experimental results show that the performance of the extended CC4 neural network is superior to that of the original CC4 neural network for the documents with large difference in scale between each other.At the same time, CC4 neural network classification accuracy and document indexing methods are closely related.
其他文献
实现服务质量保证,在多用户、多请求接入的网络中都是采取为相应请求预留资源的方式,而多请求预留资源使得网络局部出现资源碎块.单路路由算法不能利用这些资源接入用户请求.
疾病与文学看似风马牛不相及,却有着密切的关联。疾病不仅会影响到作家的健康,同时也可以成为文学的表现对象,并对患病作家的创作产生一定的影响,这在中外文学史上都可找到不少的
晚清优秀诗人郑珍,生于国势日颓的道咸之世,地处西南贵州的偏僻之所,才学深厚,经学、小学、诗文书画等无所不精,因其学术成就而被誉为“西南巨儒”,位列《清史稿·儒林传》,更以其诗
上世纪80年代初,他即以油画《春风已经苏醒》、《青春》、连环画《雪雁》等作品引起轰动,成为塑造一个民族和集体形象的代言画家。他的的艺术具诗意的特质,唯美、优雅、感伤,
很多时候,我们都在想尽办法规避掉阴影带来的干扰,但有时巧妙利用光源却能使画面产生意想不到的趣味与美感。就像那句话说的,“阴影也是可以很美的,因为那是光的赐予。”不管
期刊
当今世界,经济力与文化力日益融合,文化竞争力已成为综合国力的重要体现。在“全球化”语境下,文化创意产业近十年的发展,证明了其是最具前景、最具发展潜力的产业之一。许多发达
品色编辑王娟:西蒙的作品,游走于现实与虚构,噩梦与幻想,让人迷惑不解,却又深陷其中。在西蒙的《直到王朝降临》中,生活在迷幻破败场景中的动物,呈现出犹如人类的姿势及表情,
本文采用理论研究和文学阐释相结合的方法,以“解放政治”为核心,重构后殖民理论,并在理论重构的基础上,对V.S.奈保尔、J.M.库切和纳丁·戈迪默三位后殖民作家在解殖问题上的态度
学位
数据同步技术是移动数据库系统中消除移动客户机与数据库服务器之间数据不一致和冲突的主要方法.给出了“小金灵”移动数据库系统Lite/2中所采用的基于数据同步对象的事务性
从拍摄名模到周游世界,这位顶级旅行摄影专家坦陈自己的成功源于乐观、主动和不随波逐流。但随着对他访谈的深入,你还会有更多发现。~*Ken现在住在加拿大,是一位旅行和生活方