一种基于词序信息的自动文摘方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:guoxuemei123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动文摘技术应尽可能荻取准确的相似度以确定句子或段落的权重,但目前常用的基于向量空间模型的计算方法却忽视句子、段落、文本中词的顺序。提出了一种新的基于相邻词序组的相似度度量方法并应用于文本的自动摘要,采用基于聚类的方法实现了词序组的向量表示并以此刻画句子、段落、文本,通过线性插值将基于不同长度词序组的相似度结果予以综合。同时,提出了新的基于含词序组重要性累计度的句子或段落的权重指标。实验证明利用词序信息可有效提高自动文摘质量。
其他文献
陈述了我国当前存在的中文同种书版本辅助区分的混乱状况,论述了其统一的必要性,并建议使用“种次号=版本区分号(卷册号)”模式辅助区分同种书不同版本。
一、五大发展理念对防汛抢险工作的指导意义防汛抢险工作是水利事业的重要组成部分,是一项长期、艰巨、全面而系统的工作,具有相当的复杂性和多变性。水利工作者必须客观分析
计算机网络和电子期刊的迅速发展和普及给国内外图书馆馆藏建设带来了前所未有的冲击,本文结合期刊工作的特点和我国图书馆的实际情况,提出外文期刊采集策略。
究竟应该怎么看待当前出现的卖断乡镇卫生院产权的做法?我认为要将眼前利益与长远利益、局部利益与全局利益、部门利益与群众利益结合起来考虑,只有这样,才能经得起历史的考
随着可转换债券在中国金融市场上的份额越来越大,相关政策也鼓励上市公司发行可转债,仅17年第四季度,市场上交易的可转债数量的增长率就高达将近18个点。为此,可转债的定价显
信息安全技术是互联网经济的制高点.尽快研制出具有自主知识产权的信息安全技术是我国发展信息化、对抗霸权主义、抵制信息侵略的重要保证.本文针对存在众多不可计算问题及时