权衡熵和相关度的自动摘要技术研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:onlibao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生成高质量的文档摘要需要用简约而不丢失信息的描述文档,是自动摘要技术的一大难题。该文认为高质量的文档摘要必须尽量多的覆盖原始文档中的信息,同时尽可能的保持紧凑。从这一角度出发,从文档中抽取出熵和相关度这两组特征用以权衡摘要的信息覆盖率和紧凑性。该文采用基于回归的有监督摘要技术对提取的特征进行权衡,并且采用单文档摘要和多文档摘要进行了系统的实验。实验结果证明对于单文档摘要和多文档摘要,权衡熵和相关度均能有效地提高文档摘要的质量。
其他文献
hLDA(层次潜在狄利克雷分配)在层次主题建模中的良好效果已经得到广泛验证.为了实现半监督或无监督,通常采用交叉验证或抽样超参来确定参数.但由于语料特征、建模需求等不确定
意见挖掘已成为近年来的热点问题,该文针对COAE2009评测中的意见挖掘任务的一项子任务——评价对象抽取进行了研究。首先提出利用核心句进行学习的思想,继而确定了10种句法关
该文研究有监督学习方法在多文档文本情感摘要中的应用。利用从亚马逊中文网和亚马逊英文网上收集的产品评论语料,抽取文本内特征、PageRank特征、情感特征和评论质量特征,基
莎拉-布莱曼将于6月6日在广州举行演唱会。记者从主办方那里获悉,她这次巡演将会为中国观众献唱多首她最经典的音乐剧唱段和歌舞剧选段,演唱曲目的风格不再局限于古典、流行
该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,
抽取式摘要是从正文中按照一定策略抽取重要句子组成摘要。该文提出了一种句子抽取方法。基本思想是将句子的抽取看作序列标注问题,采用条件随机场模型对句子进行二类标注,根
将含有鸡传染性支气管炎病毒S1基因CDNA的重组转移质粒pSXIVVIX3-S1.Holte和pSXIVVIX3/4-S1.Holte分别与粉纹夜蛾型多角体病毒TnNPV-SVIGDNA(OCC,gal)共转染草地夜蛾(Sf9)细胞,经空斑纯化得到重通病毒TnNPV-(X3)S1.Holte-OCC和TnNPV-(X3/4)S1.Holte-OCC。将重组毒株分别感染Tn-5B1细胞,并进行SDS
<正>~~
初次领略奥地利的美景,感受它音乐的魅力。是在电影《音乐之声》中。这部在第38届奥斯卡评选中获得最佳影片等五项大奖的音乐巨作,令我一次又一次陶醉其中。白雪皑皑的阿尔卑