【摘 要】
:
文章提出了一种基于概念统计和语义层次分析的自动文摘方法,并以此实现了一个英文自动文摘系统.系统利用WordNet对英文文章进行词语分析,用概念统计的方法选取文章的主题概念
论文部分内容阅读
文章提出了一种基于概念统计和语义层次分析的自动文摘方法,并以此实现了一个英文自动文摘系统.系统利用WordNet对英文文章进行词语分析,用概念统计的方法选取文章的主题概念,以此构建向量空间模型;并根据主题概念在概念层次树上的分布划分意义块,以意义块为单位抽取文摘,初步解决多主题文章的文摘结构不平衡问题.该文主要介绍概念层次树的构造,主题概念的抽取步骤,句子重要度的计算和意义块的划分算法.测试表明该文提到的方法比传统的基于词频统计的方法有更高的召回率与精确率.
其他文献
根据油田加热炉节能改造之实际需要,研究了火筒式加热炉改造用热管元件优化设计方法,以热管流动阻力为目标函数建立了数学模型,并采用混合罚函数(SUMT)法对实际问题进行了求
由于EV(Errors-in-Variables)模型(也称测量误差模型)的最大似然估计由正交回归给出,而正交回归对污染数据是敏感的,所以,需要采用稳健的统计方法来估计模型参数本文在多元EV
β-半乳糖苷酶能够水解牛乳和其它乳制品中的乳糖,同时还具有转半乳糖苷作用.本文通过实验分析了米曲霉β-半乳糖苷酶的酶学性质,并证实了其对乳糖的水解作用.
针对非线性船舶控制的困难,提出采用多模型智能控制的思想方法.非线性船舶模型可以在其关键工作点线性化,例如:N个工作点.这样就得到N个简单的线性模型.这N个线性模型能够很
点到点隧道协议(PPTP)是用来保证TCP/IP上的PPP连接安全的。由于MS-CHAP中存在的安全问题,Mi-crosoft发布了新版本的MS-CHAPv2。文章将概述MS-CHAPv2中对认证和加密密钥产生
随着交通事故及各种高能量损伤的日益增多,胫骨缺损病例在临床十分多见,治疗非常棘手.20世纪80年代以前主要以传统单纯自体骨植骨治疗为主,由于其"爬行替代"的愈合机制,对超
企业信息平台实现有业务往来的各应用系统之间的交互,同时从分散的各应用系统中提取公共信息,为企业信息发布提供及时、可靠的数据.文章介绍企业信息平台的设计方案,并探讨消
为了根据所给的客流量及运营情况排出公交车调度时刻表,并尽可能地满足乘客与公交公司双方的利益,我们建立了基于图形分析的模型一和基于计算机模拟的模型二,并在模型扩展中
关联规则作为一种数据挖掘的工具,它能够发现数据项集之间有趣的关联.在关联规则的算法中,Apriori算法是其中的关键算法之一.面对大量复杂的数据集,怎样选择数据结构,怎样优
文章在研究分析城市深基坑支护工程众多因素的关系和特性的基础上,建立了城市深基坑支护体系的遗传优化数学模型,提出了一种适用的基于遗传算法的两层协同演化模型。该模型为