论文部分内容阅读
随着我国经济硬实力的不断提高,对于教育软实力的需求也在不断增加。人们对教育的重视程度不断加深,也带来了激烈升学竞争,学生的学习压力和学习负担不断加重。而现实的教学方式,无法满足学生所需求的答疑解惑,学生希望可以在遇到关于知识的疑难点时能够随时随地的通过问答方式的一对一解答。因此在这个互联网的大时代下,建立初中数学领域问答系统变得可行。本文设计了一种多策略的初中数学领域问答系统。对于基础性知识,采用相似度匹配的方法进行答案的选取。首先,对输入的问句进行中文分词、问题分类、抽取关键词以及关键词扩展,形成一系列关键词的集合;然后,对问题的类型进行判断形成候选问题集合,将关键词集合与候选问题集合进行相似度计算,得到一个结果集合;最后,对结果集合进行排序选择相似度最高的项作为输出。对于一元一次方程应用题,利用文本信息提取方法和知网知识系统描述语言方法,对平均类的一元一次方程应用题的结构进行形式化的表达。此外,根据信息抽取模式的含义,结合数学运算方法,提出了知识运算集形式化表达的定义及其表示方法。该定义将数学应用题中有用的信息进行提取,将具体运算值赋值于知识运算集中的运算变量,再进行求解。最后采用B/S的模式,通过SpringBoot框架,开发初中数学领域的中文问答系统。本文的主要工作主要包括:(1)对现有的半结构化电子文档进行知识抽取,利用爬虫对互联网上的非结构化页面知识进行爬取解析;同时构建初中数学领域知识库并建立初中数学领域词典。(2)对问句采用自然语言处理技术分析,然后结合句子相似度的计算方法,对答案集合结合进行打分并设定阈值,最后对答案集合进行排序,选取分数最高的项作为最佳匹配结果。(3)对一元一次方程应用题进行了形式化的定义,依据知网知识系统描述语言对平均类问题的一元一次方程应用题进行了形式化的表达。(4)根据信息抽取模式和数学运算法则,本文提出了知识运算集的形式化定义及其表示方法,对平均类问题的一元一次方程应用题进行求解。(5)开发出一个多策略的初中数学领域问答系统,为初中生提供关于数学基本知识常见问题以及某些平均类一元一次方程应用题的解答。(6)设计实验,对四种不同的句子相似度算法进行分析,得出各个算法的优缺点,并采取最优的句子相似度算法为本文的关键算法。