统计与理解相结合的英文自动文摘研究与实践

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sufaya0505
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文研究了一种统计和理解相结合的英文自动文摘方法并实现了一个英文自动文摘系统.该文首先提出了一种新的篇章机内表示方法--篇章结构二叉树.该文还研究了英文词类标记方法,词类自动标对自动文摘中特征词的提取具有重要的意义.由于自动文摘的实际需要,该文研究了文本结构的自动分析方法.该方法是基于这样的考虑:该文结构的正确分析可帮助大家最大限度地提取文本中的有效信息.基于这一考虑,笔者提出了一种文本结构自动分析的方法,并给出了其数学模型及实现算法.该文还提出了一种的内容词,有效词和特征词的动态加权函数以及句子重要性的动态加权函数,词的重要性动态加权函数应与该词所含的单词数成正比,也与该词的词频正比.基于上面的研究,设计并实现了一个非受限域的英文自动文摘系统HIT-98EAAS,并通过大量的实验验证了该系统的有效性.
其他文献
该文主要介绍了大直径测量仪的软硬件总体设计,大直径测量仪与用户接口(LED显示、打印输出、语音输出)的实现,重点论述了光电传感器的设计,如何通过传感器中的距离微调机构、
软件构件化是软件重用技术的重要内容,在分布式计算环境的支持下,基于构件的分布式实时应用系统构造技术是目前软件重用方向的研究热点与难点。分布式实时应用系统的开发既要求
该论文结合济南将军集团的一个信息管理系统--考勤检测系统的实现,讨论了一种在Intranet网络上实现工业控制检测和信息管理的解决方案.在该方案中,首先讨论了在该集团具有ATM
利用集群廉价的设备构建昂贵的企业级高端计算机系统一直以来都是分布式系统领域中的重要研究课题。在存储系统领域中也正发生着类似的转变。由磁盘阵列控制器、光纤通道和磁
该论文的目标是提出一种机制,用于改进Web导航设施的易用性.作者给出了一个新 的概念thumbnail.Thumbnail的本意是极小的东西,简略描述,略图等.这里用这个词表示Web导航设施
对象间的关系在面向对象的软件开发中具有至关重要的地位,是程序复杂度的主要来源.但目前OOPL中还缺乏对对象间关系的显式描述机制.该文从系统建模中清晰地描述复杂系统的层
随着计算机网络、分布式计算技术的迅速发展,使得实时存取分布在网络不同结点上的信息成为可能,于是分布式实时数据库技术便应运而生。分布式实时数据库系统是分布式数据库系统
该学位论文的主要研究方向是ATM交换机体系结构,研究和开发工作主要包括以下五 部分:1)经过阅读大量文献,综述了交换技术及ATM技术的产生、发展现状及发展趋势;介 绍了ATM交
该文就利用次声-电磁波双信号定位技术对闪电进行定位测量进行探讨.简单介绍闪电辐射电磁波和产生次声波的模式,给出声速方程;在已有的观测资料的基础上,讨论并给出闪电的次
随着网络和计算机技术的迅速发展,互联网技术、电子商务以及办公自动化等应用不断地扩展,使数据信息呈现爆炸性增长趋势,从而带动了存储市场的迅速增长。于是,对大容量、高数传率