论文部分内容阅读
随着我国教育信息化建设的不断推进,数字化教育资源库的发展同益成熟,积累了大量知识丰富的教学资源。这些资源基本上采用了基于学科、年级、知识点等组织方式,提供基于“关键字”的查询方式,却无法实现知识点之间的关联,无法提供给学生和老师面向“问题解答”的更加开放的知识内容检索,无法实现更高层次上的对教学资源库内容的信息提取和知识综合。
真正有效的知识获取应该是面向问题的知识获取--针对自然语言的提问给出问题的解答。针对目前已经建构起来的大量优质的教学资源,本文引入了智能答疑系统,将优质的教学资源库作为答案的来源并以此为基础构建问题库。这样一方面可以充分利用已经构建好的优质资源,提高教学资源库的利用效率;另一方面可以方便用户获取想要的知识,解决知识获取的有效性问题。本论文主要对如何在资源库的基础上构建问题库进行了探索。
本论文主要工作包括以下两部分:
(1)问句构造。基于教学资源库进行问句抽取。抽取过程中,根据问句抽取的问点信息如时间(分为日期型、相对型和频指型)、地点、人物等信息,在教学资源库句子相应的位置上标注出与问句问点对应的答案信息,将构造出的问句按结构化或半结构化的方式保存到FAQ集中。
(2)问句匹配。当用户进行提问时,将用户提出的问题与FAQ集中的问句进行相似度计算,在FAQ集中找到相似度最高的问句,并将该问句对应的问点答案呈现给用户。
在问句构造部分,本论文主要讨论了问点为时间、地点、人物的问句构造过程,并着重分析了有关时间领域的问句模板和问句构造。在问句匹配部分,本论文构建了问句匹配模型,并对问句匹配过程中涉及到的关键算法做了详细的设计与论证。
实验证明,在教学资源库的基础上构建问题库不仅可以为师生提供“面向问题的解答”,提高教学资源库的利用率,而且对提高答案的精确度也是有益的。