论文部分内容阅读
提出了一种基于测地距离的多文档方法。该方法首先利用可以揭示高维向量相似度的测地距来代替传统的向量夹角作为句子相似度的对比基础,然后通过TextTiling算法进行分割文本,利用基于Wordnet的概念向量空间模型消歧计算段落相似度来构建“文本关系图”产生文摘。在DUC上的实验结果表明,该算法能够有效地生成非受限领域的多篇文档并全面反映文档的主要内容并能有效地提高文档的质量。