论文部分内容阅读
该论文首次提出了基于篇章局部统计模型的关键词提取方法.在PAT Tree的基础上,设计了提取篇章中最长相关字串的快速算法,并通过最长相关字串在全局语料中分布的SIG指标对最长相关字串的质量进行评价,充分体现了语言的局部性与全局性特点,利用SIG指标,可以有选择地提取语料中不同类型的语言知识.