论文部分内容阅读
自然语言的灵活性和多样性,使得让计算机从文本中抽取主题十分困难的问题。该文介绍了三种从汉语文本中抽取主题的方法。第一种方法基于部件词典,第二种方法基于主题词词典,第三种方法基于统计方法。为了测试三种方法,研究人员设计了三个独立的系统。实验结果是启发性并令人鼓舞的;每种方法都能在一定程度上抽取出反映主题的字串。然而,也许需要结合这些方法的优点得到一种更好的方法。