论文部分内容阅读
针对通过Extractive方式实现自动文摘而存在文本连贯性欠缺和出现未登录词问题,提出一种基于改进Encoder-Decoder模型的新闻摘要生成方法。首先,在数据预处理的过程中融入额外的语言特征,如词语的词性和TF-IDF,使词语具有多维度的含义;其次,采用Decoder/Pointer机制在摘要中指向原文本中的位置对低频词进行处理;最后,采用注意力机制来协助模型记忆输入数据并确定其注意程度。在News2016zh数据集上进行实验,结果表明基于改进Encoder-Decoder模型与基线Enco