论文部分内容阅读
文本相似度计算技术在自然语言处理技术领域中具有基础而又重要的地位。为了适应知识时代发展和满足信息处理技术的需要,本文提出多维概念关联模型的建模及基于此的句子相似度计算方法并应用到教学实践中。论文主要针对语义网络和知网的局限,提出了多维概念关联模型。与用于知识表达的语义网络法比较,本模型所定义的概念,是一个实体类而不仅仅是一个语义单元;与目前广泛使用的词网或知网比较,本模型设计的概念关系不仅包含词间关系而且包含语境语义关系。多维概念关联模型实现了名词到动词的映射,让特征的关联关系更明确,提出一种概念之问的关系——类比-分析关系,让概念之间的关系更明确,就使得计算句子相似度时更精确,相对于现存的向量空间法,基于概念的词集归并,能让粗搜索的空间增大,但在二次检索后精简,就会得到精准而确切的期望值。接着建立多维概念关联模型和建立语句架构,并在此基础上提出基于多维概念关联模型的句子相似度度量方法。计算句子相似度的思想:首先提取待处理文本的语句架构,再建立句子的多维概念关联模型,利用核心词寻找局部多维概念关联模型,再与局部多维概念关联模型匹配,最后计算它们的相似度。论文综合计算了句子的语义结构和词汇语义的相似度,最后实现一个基于多维概念关联模型的文本相似度计算系统,并将其应用于计算机辅助教学中的主观题自动评分,用以证明此方法的有效性。