论文部分内容阅读
关键词抽取在文本聚类、文本分类、文本摘要等许多文本处理领域有着重要作用。本文介绍了文本语言网络的概念和三种类型的语言网络;进而提出了一种基于语言网络和Pagerank的关键词抽取算法:首先,将文本表示为一个语义网络,然后应用PageRank决定文本语义网络中词语的重要度,最后选择前N个重要词语作为文档的关键词。在对CISTR学术论文库抽取关键词的实验中,证明了算法的有效性。