论文部分内容阅读
我们根据"中文信息结构"的理论,以《知网》和《知网-中文信息结构库》为主要资源,开发了中文语块抽取器.本文简要的介绍了中文信息结构的理论,重点说明了中文语块抽取器的工作原理、过程、实现方法及其独有的特征.重点包括以下几个方面:切分、组词、消歧和中文语块抽取以及本系统重要的组成部分—信息结构解析器.中文语块抽取器将可用于中文文本的部分分析,计算机辅助的中文语块库的建设,结构和语义消歧,以及将可成为信息抽取(如实体、事件等)的工具.